{{category 仕様}}

EUC (Extended Unix Code)は、ASCIIと2バイト文字コードを一緒に運用する方式のひとつです。

8ビット符号表のGL領域(0x20-0x7F)にはASCIIを呼び出し、GR領域(0xA0-0xFF)には2バイトコードを呼び出した状態で使います。2バイトコードは、例えばJIS X 0208や中国のGB2312、韓国のKS X 1001などです。

日本のEUC-JIS-2004やEUC-JP、中国のEUC-CN、韓国のEUC-KR、台湾のEUC-TWといった種類があります。

!!特徴

[[ISO/IEC 2022]]に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。

2バイトコードと1バイトコードのバイト値の範囲が重なっていません。MSBが0のバイトは常にASCIIです。

!!JIS X 0213におけるEUC

JIS X 0213は附属書3でEUC-JIS-2004を定義しています。内容はEUC-JIS-2004の項を参照してください。

!!JIS X 0208におけるEUC

EUC-JPの項を参照してください。

!!関連項目

* EUC-JIS-2004
* EUC-JP