EUC-JP
[カテゴリ:仕様]
EUC-JPは、JIS X 0208をASCIIとともに運用する方式(いわゆる文字符号化方式)です。
符号の構造
8ビット符号表に下記のように符号化文字集合を割り当てたものです。
- GL領域(0x20-0x7F): ASCII (1バイトコード)
- GR領域(0xA0-0xFF): JIS X 0208 (2バイトコード)
- ただし、0x8Eの直後1文字はJIS X 0201片仮名 (1バイトコード)
- ただし、0x8Fの直後1文字はJIS X 0212 (2バイトコード)
0x8F, 0x8EはISO/IEC 2022で取り決められているシングルシフトの制御コードです。
なお、JIS X 0201片仮名, JIS X 0212の使用は元々オプションの扱いで、今日でも対応していない実装が見られます。
由来
EUCはExtended Unix Codeという名のとおりUnix系OSでの日本語用文字コードとして開発されたもので、元々はJISで決められたものではありません。ただし、その中心部分、つまりASCIIとJIS X 0208の部分は、JIS X 0208:1997の「国際基準版・漢字用8ビット符号」と同一です。
JIS X 0213との関係
JIS X 0213では、EUCに対応する符号化方式としてEUC-JIS-2004が定義されています。EUC-JPのJIS X 0212を用いない場合に対して上位互換となっています。
EUC-JPにおけるJIS X 0212は、EUC-JIS-2004ではJIS X 0213の漢字集合2面に相当します。ここで、X0213の漢字集合2面はJIS X 0212で文字の割り当てられていない区点位置のみを使用しているので、JIS X 0213かJIS X 0212のどちらが使われているかを判断することができます。
最終更新時間:2016年11月26日 13時25分29秒