検索
- BBS-相談所/3 -
!![[Re: ISO-2022-JP-2004 vs Unicode mapping table|BBS-相談所/3]] - えむけい (2006年06月06日 06時01分35秒)
- EUC -
[[ISO/IEC 2022]]に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。
- EUC-JP -
0x8F, 0x8Eは[[ISO/IEC 2022]]で取り決められているシングルシフトの制御コードです。
- GB 2312 -
[[ISO/IEC 2022]]に準拠した構造をしています。GL領域にASCIIを、GR領域にこの2バイトコードを呼び出した格好のEUC-CNがよく使われます。
- ISO -
文字コードの分野では、ASCII相当の[[ISO/IEC 646]]、文字コードの構造と拡張法を定める[[ISO/IEC 2022]]、欧州言語の文字の8ビットコード[[ISO/IEC 8859]]、国際符号化文字集合[[ISO/IEC 10646]]といった主要な規格をIEC (国際電気標準会議)とともに開発しています。
- ISO-2022-JP - ISO-2022-JP
- ISO/IEC 2022 - ISO/IEC 2022
- ISO/IEC 646 -
EUC-JIS-2004やISO-2022-JP-2004もそれらの中に含まれます。
- ISO/IEC 8859-1 -
[[ISO/IEC 2022]]と整合的な1バイト符号化文字集合として定義されています。
- ISO/IEC 8859-2 -
[[ISO/IEC 2022]]と整合的な1バイト符号化文字集合として定義されています。
- JIS -
1995年以降、WTO/TBT協定によって、国内規格はISOやIECのような国際規格と整合性が取られるよう改訂されています。日本の文字コード規格はもともと国際規格 [[ISO/IEC 2022]] と整合するよう規定されてきましたが、1995年以降の改訂では、規格の標題や構成のような形式的な面からも整合が図られています。また、[[ISO/IEC 10646]]と技術的に一致する(identicalな)国内規格JIS X 0221が制定されるなどしています。
- JIS X 0201 -
[[ISO/IEC 2022]]に整合的なコードです。
- JIS X 0208 -
[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合として設計されています。
- JIS X 0212 -
[[ISO/IEC 2022]]に整合的な2バイト符号化文字集合です。従って、ISO/IEC 2022の枠組みに則って、JIS X 0208と組み合わせあるいは切り替えて用いることができます。例えば、EUC-JPではシングルシフトコードによってGRの文字集合をJIS X 0208と切り替えたり、ISO-2022-JP-2ではエスケープシーケンスによって指示して使うことができます。
- JIS X 0213 -
JIS X 0208に不足していた現代日本の文字を符号化することをねらいとし、JIS X 0208の上位互換として設計されています。[[ISO/IEC 2022]]に整合的な形の、漢字集合1面・漢字集合2面という2つの2バイト符号化文字集合が定義されています。
- JIS2004 -
これに応じて、附属書1から3の符号化方式の名称が、Shift_JIS-2004, ISO-2022-JP-2004, EUC-JIS-2004と変更されています。2000年版ではそれぞれ、Shift_JISX0213, ISO-2022-JP-3, EUC-JISX0213でした。
- KS X 1001 -
[[ISO/IEC 2022]]に準拠した構造をしています。GL領域にASCIIを、GR領域にこの2バイトコードを呼び出した格好のEUC-KRがよく使われます。
- MSB -
ISO-2022-JP-2004やISO-2022-JPでは、符号化されたデータ全てにおいてMSBは0になります。つまり、7ビットのコードです。
- エスケープシーケンス -
文字コードにおいてエスケープシーケンスとは、制御文字エスケープ (0x1B) とその後に続く何バイトかの列のことです。文字コードの構造と拡張法を定める国際規格[[ISO/IEC 2022]]において、符号化文字集合の切り替えに用いられます。
- 漢字集合1面 -
この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「16区1点」のように表されます。漢字集合2面と区別するために、面番号を先頭につけた面区点番号 (例えば「1面16区1点」)が、符号位置を示すのによく使われます。
- 漢字集合2面 -
この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「1区1点」のように表されます。漢字集合1面と区別するために、面番号を先頭につけた面区点番号が、符号位置を示すのによく使われます。面区点番号は例えば「2面1区1点」のように記します。しばしば「2-1-1」のように略記されます。
- 国際基準版・漢字用8ビット符号 -
* 8ビットを用いる (ISO-2022-JPは7ビット)
- 代替名称 -
例えば、国際基準版・漢字用8ビット符号のように、JIS X 0208と[[ISO/IEC 646]]国際基準版とともに用いる場合、ラテン文字や数字等が両方に存在します。このようなとき、重複符号化を避けるため、どちらか片方 ([[ISO/IEC 2022]]にのっとる場合、指示されるG番号の小さい方) のみを使用することになります。ただし、慣用的に「全角・半角」として異なる文字であるかのように使われてきた経緯があるため、「これまでの慣用的な利用との互換を目的としてだけ,附属書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい」(JIS X 0208:1997 7.2節)とされています。この附属書5「文字の代替名称」には、このような目的に使用できる代替名称が決められています。
- 符号化文字集合 -
また、附属書1から3において、Shift_JIS-2004, ISO-2022-JP-2004, EUC-JIS-2004を定義していますが、これらも上記の定義における符号化文字集合です。