トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

EUC

[カテゴリ:仕様]

EUC (Extended Unix Code)は、ASCIIと2バイト文字コードを一緒に運用する方式のひとつです。

8ビット符号表のGL領域(0x20-0x7F)にはASCIIを呼び出し、GR領域(0xA0-0xFF)には2バイトコードを呼び出した状態で使います。2バイトコードは、例えばJIS X 0208や中国のGB 2312、韓国のKS X 1001などです。

日本のEUC-JIS-2004EUC-JP、中国のEUC-CN、韓国のEUC-KR、台湾のEUC-TWといった種類があります。

特徴

ISO/IEC 2022に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。

2バイトコードと1バイトコードのバイト値の範囲が重なっていません。MSBが0のバイトは常にASCIIです。

JIS X 0213におけるEUC

JIS X 0213は附属書3でEUC-JIS-2004を定義しています。内容はEUC-JIS-2004の項を参照してください。

JIS X 0208におけるEUC

EUC-JPの項を参照してください。

関連項目

最終更新時間:2023年07月08日 14時10分25秒