EUC
[カテゴリ:仕様]
EUC (Extended Unix Code)は、ASCIIと2バイト文字コードを一緒に運用する方式のひとつです。
8ビット符号表のGL領域(0x20-0x7F)にはASCIIを呼び出し、GR領域(0xA0-0xFF)には2バイトコードを呼び出した状態で使います。2バイトコードは、例えばJIS X 0208や中国のGB 2312、韓国のKS X 1001などです。
日本のEUC-JIS-2004やEUC-JP、中国のEUC-CN、韓国のEUC-KR、台湾のEUC-TWといった種類があります。
特徴
ISO/IEC 2022に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。
2バイトコードと1バイトコードのバイト値の範囲が重なっていません。MSBが0のバイトは常にASCIIです。
JIS X 0213におけるEUC
JIS X 0213は附属書3でEUC-JIS-2004を定義しています。内容はEUC-JIS-2004の項を参照してください。
JIS X 0208におけるEUC
EUC-JPの項を参照してください。
関連項目
- EUC-JIS-2004
- EUC-JP
- 国際基準版・漢字用8ビット符号 - JIS漢字コード規格におけるEUCと同等の符号
最終更新時間:2023年07月08日 14時10分25秒