検索
- ASCII -
国際規格である[[ISO/IEC 646]]の国際基準版は、ASCIIと同等の文字コードです。
- BBS-相談所/3 -
ISO-2022-JP-2004の対応表ですが、ISO/IEC 646 IRVと重複する文字も漢字7ビット符号の対応表と同様に割り当てるのではないですか?
- BMP -
BMP (Basic Multilingual Plane, 基本多言語面)は、Unicode並びに[[ISO/IEC 10646]]の面00に付けられた呼び名です。
- CJK互換漢字 -
CJK互換漢字とは、Unicodeならびに[[ISO/IEC 10646]]において、CJK統合漢字とは別に、他の文字コードとの互換性のために用意されている漢字の符号位置です。
- CJK統合漢字 -
CJK統合漢字とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて、東アジアの漢字文化圏各国の漢字コード規格にある漢字を統合して作成された漢字集合です。CJKという呼び方はChina, Japan, Koreaの頭文字から来ています。
- GB 2312 -
GB 2312は、[[ISO/IEC 10646]] (Unicode)のCJK統合漢字が最初に作られた際に元になった漢字集合のひとつです。
- ISO -
文字コードの分野では、ASCII相当の[[ISO/IEC 646]]、文字コードの構造と拡張法を定める[[ISO/IEC 2022]]、欧州言語の文字の8ビットコード[[ISO/IEC 8859]]、国際符号化文字集合[[ISO/IEC 10646]]といった主要な規格をIEC (国際電気標準会議)とともに開発しています。
- ISO/IEC 10646 - ISO/IEC 10646
- ISO/IEC 2022 -
[[ISO/IEC 10646]]以前の主要な国際・国内の文字コード規格はISO/IEC 2022と整合的な
- ISO/IEC 646 - ISO/IEC 646
- ISO/IEC 8859 -
* GL領域(0x20-0x7F)は、[[ISO/IEC 646]]国際基準版(ASCIIと同じ)
- ISO/IEC 8859-1 -
8ビット符号表のGL領域(0x20-0x7F)に[[ISO/IEC 646]]国際基準版(ASCIIと同じ)、GR領域(0xA0-0xFF)にはこの規格が定める文字集合を置いた形で使われます。
- ISO/IEC 8859-2 -
8ビット符号表のGL領域(0x20-0x7F)に[[ISO/IEC 646]]国際基準版(ASCIIと同じ)、GR領域(0xA0-0xFF)にはこの規格が定める文字集合を置いた形で使われます。
- JIS -
1995年以降、WTO/TBT協定によって、国内規格はISOやIECのような国際規格と整合性が取られるよう改訂されています。日本の文字コード規格はもともと国際規格 [[ISO/IEC 2022]] と整合するよう規定されてきましたが、1995年以降の改訂では、規格の標題や構成のような形式的な面からも整合が図られています。また、[[ISO/IEC 10646]]と技術的に一致する(identicalな)国内規格JIS X 0221が制定されるなどしています。
- JIS X 0201 -
ラテン文字集合はASCIIならびに[[ISO/IEC 646]]国際基準版とほぼ同じですが、
- JIS X 0208 -
運用方法(いわゆる文字符号化方式)として、JIS X 0208を単体で用いる方式(すなわち2バイト固定長)のほか、JIS X 0201ならびに[[ISO/IEC 646]]国際基準版(ASCIIと同等)と同時に用いる方式(すなわち1バイトと2バイトが混在)を定義しています。また、附属書において[[シフトJIS|Shift_JIS]]とISO-2022-JP (RFC1468)を取り込んでいます。
- JIS X 0213 -
*国際基準版・漢字用7ビット符号 - [[ISO/IEC 646]]国際基準版と漢字集合1面をSI/SOで切り替え。SS3で漢字集合2面
- JIS X 0221 -
JIS X 0221は、[[ISO/IEC 10646]]と技術的内容が同一である日本の対応規格です。表題を「国際符号化文字集合 (UCS)」としています。
- JIS2004 -
ただし、表外漢字字体表にあわせるとUnicode ([[ISO/IEC 10646]] UCS) との対応に問題を生じるものが10文字あったことから、これらについては独立した符号位置が新たに与えられました。これを表外漢字UCS互換といいます。
- KS X 1001 -
KS X 1001は、[[ISO/IEC 10646]] (Unicode)のCJK統合漢字が最初に作られた際に元になった漢字集合のひとつです。
- UTF-16 -
他方、Unicodeと同等の文字コード規格[[ISO/IEC 10646]]ではUCS-4という4バイトコードが定義されており、これを使うと65,536符号位置からなる面をいくつも扱うことが可能でした。Unicodeの16ビットの符号空間は面00, Basic Multilingual Plane (BMP) という位置付けです。
- UTF-8 -
* [[ISO/IEC 10646]]
- Unicode -
* [[ISO/IEC 10646]] - ISOとIECによる、Unicodeと同等の文字コードの公的標準。
- エスケープシーケンス -
,ASCIIないし[[ISO/IEC 646]]国際基準版,1B 28 42,ESC ( B
- キリル文字 -
* Unicode / [[ISO/IEC 10646]]
- ギリシャ文字 -
* Unicode ならびに [[ISO/IEC 10646]]
- ソフトハイフン -
!!UnicodeならびにISO/IEC 10646におけるソフトハイフン
- チルダ -
!!ASCIIならびにISO/IEC 646におけるチルダ
- ノーブレークスペース -
!!UnicodeならびにISO/IEC 10646におけるノーブレークスペース
- ハイフンマイナス -
ハイフンマイナスとは、ASCII等にある、ハイフンにもマイナス記号にも使われる、意味合いの曖昧な記号を便宜的にUnicodeないし[[ISO/IEC 10646]]で名付けたものです。
- ラテン文字 -
* ASCII ならびに [[ISO/IEC 646]]国際基準版 - 英語に用いる26文字の大文字小文字。
- 円記号 -
!!Unicodeならびに[[ISO/IEC 10646]]における円記号
- 漢字 -
!!ISO/IEC 10646ならびにUnicodeにおける漢字
- 国際基準版・漢字用8ビット符号 -
国際基準版・漢字用8ビット符号は、JIS X 0208ならびにJIS X 0213で規定される符号化方式のひとつです。2バイトの漢字コードを[[ISO/IEC 646]]国際基準版 (ASCIIと同じ1バイトコード) と同時に運用するものです。一般的にEUCと呼ばれるコードに対応します。
- 代替名称 -
例えば、国際基準版・漢字用8ビット符号のように、JIS X 0208と[[ISO/IEC 646]]国際基準版とともに用いる場合、ラテン文字や数字等が両方に存在します。このようなとき、重複符号化を避けるため、どちらか片方 ([[ISO/IEC 2022]]にのっとる場合、指示されるG番号の小さい方) のみを使用することになります。ただし、慣用的に「全角・半角」として異なる文字であるかのように使われてきた経緯があるため、「これまでの慣用的な利用との互換を目的としてだけ,附属書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい」(JIS X 0208:1997 7.2節)とされています。この附属書5「文字の代替名称」には、このような目的に使用できる代替名称が決められています。
- 波ダッシュ -
また、Unicodeと同等の国際規格ISO/IEC 10646の翻訳規格JIS X 0221の1995年版でもJISの1区33点の波ダッシュをU+301Cに対応付けており、各文字に文字名を規定するようになったJIS X 0208:1997はそれを反映して1区33点にWAVE DASHという文字名を与えました(日本語通用名称はそれ以前から「波ダッシュ」)。このように、UnicodeのU+301C WAVE DASHがJISの1区33点の波ダッシュに対応することは一貫しています。
- 波ダッシュ問題 -
表の中の「文字名」は、JIS X 0208にて規定されている文字名であり、Unicode ([[ISO/IEC 10646]] UCS) の文字名に対応します。
- 表外漢字UCS互換 -
表外漢字UCS互換とは、JIS X 0213の2004年改正で第3水準漢字に追加された10文字です。ここでいうUCSとは[[ISO/IEC 10646]] UCS (Universal Coded Character Set, 国際符号化文字集合)のことです。JIS X 0213の例示字形を表外漢字字体表に合わせる際にUCSとの互換性の問題から設定されたものです。
- 符号位置 -
[[ISO/IEC 646]]やASCII、JIS X 0201のような1バイトコードでは、符号位置はx/yのような形で示されます。xとyはそれぞれ0以上の整数で、符号表の列と行を表します。x/yの形で示された符号位置はビット組み合わせに一意に対応します (参照: ISO/IEC 646:1991の5.2節)。
- 符号化文字集合 -
これは[[ISO/IEC 646]]や[[ISO/IEC 8859]]といった国際規格における定義と同等の内容です。例えば[[ISO/IEC 646]]:1991では下記のように定義されています。ASCIIを定めるANSI X3.4でも同じです。
- 文字名 -
文字名とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて各文字(符号位置)に与えられた名前です。ラテン大文字で付けられています。
- 包摂 -
!!ISO/IEC 10646の包摂規準