{{category 仕様}} EUC-JPは、JIS X 0208をASCIIとともに運用する方式(いわゆる文字符号化方式)です。 !!符号の構造 8ビット符号表に下記のように符号化文字集合を割り当てたものです。 *GL領域(0x20-0x7F): ASCII (1バイトコード) *GR領域(0xA0-0xFF): JIS X 0208 (2バイトコード) **ただし、0x8Eの直後1文字はJIS X 0201片仮名 (1バイトコード) **ただし、0x8Fの直後1文字はJIS X 0212 (2バイトコード) 0x8F, 0x8Eは[[ISO/IEC 2022]]で取り決められているシングルシフトの制御コードです。 なお、JIS X 0201片仮名, JIS X 0212の使用は元々オプションの扱いで、今日でも対応していない実装が見られます。 !!由来 EUCはExtended Unix Codeという名のとおりUnix系OSでの日本語用文字コードとして開発されたもので、元々はJISで決められたものではありません。ただし、その中心部分、つまりASCIIとJIS X 0208の部分は、JIS X 0208:1997の「国際基準版・漢字用8ビット符号」と同一です。 !!JIS X 0213との関係 JIS X 0213では、EUCに対応する符号化方式としてEUC-JIS-2004が定義されています。 EUC-JPのJIS X 0212を用いない場合に対して上位互換となっています。 EUC-JPにおけるJIS X 0212は、EUC-JIS-2004ではJIS X 0213の漢字集合2面に相当します。ここで、X0213の漢字集合2面はJIS X 0212で文字の割り当てられていない区点位置のみを使用しているので、JIS X 0213かJIS X 0212のどちらが使われているかを判断することができます。 !!関連項目 * EUC-JIS-2004 * 国際基準版・漢字用8ビット符号