{{category 仕様}} EUC (Extended Unix Code)は、ASCIIと2バイト文字コードを一緒に運用する方式のひとつです。 8ビット符号表のGL領域(0x20-0x7F)にはASCIIを呼び出し、GR領域(0xA0-0xFF)には2バイトコードを呼び出した状態で使います。2バイトコードは、例えばJIS X 0208や中国のGB 2312、韓国のKS X 1001などです。 日本のEUC-JIS-2004やEUC-JP、中国のEUC-CN、韓国のEUC-KR、台湾のEUC-TWといった種類があります。 !!特徴 [[ISO/IEC 2022]]に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。 2バイトコードと1バイトコードのバイト値の範囲が重なっていません。MSBが0のバイトは常にASCIIです。 !!JIS X 0213におけるEUC JIS X 0213は附属書3でEUC-JIS-2004を定義しています。内容はEUC-JIS-2004の項を参照してください。 !!JIS X 0208におけるEUC EUC-JPの項を参照してください。 !!関連項目 * EUC-JIS-2004 * EUC-JP * 国際基準版・漢字用8ビット符号 - JIS漢字コード規格におけるEUCと同等の符号