トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

ISO-2022-JP

[カテゴリ:仕様]

ISO-2022-JPは、JIS X 0208ASCIIエスケープシーケンスによって切り替える運用方式(いわゆる文字符号化方式)です。7ビットのみを用います。電子メールにおいてよく使われます。

ISO-2022-JPは元々、日本におけるインターネットの電子メールなどの運用(JUNETコード)を明文化する形でRFC 1468として定義されました。JIS X 0208:1997の附属書2 (RFC1468符号化表現)にも取り込まれています。

名前が紛らわしいのですが、ISO-2022-JPはISOで定義されている文字コードではありません。ISO/IEC 2022の仕組みの一部を用いて日本の文字コードASCIIとともに運用する一方式です。

符号の構造

7ビットのみを用いる、1バイト文字集合と2バイト文字集合を切り替えて使用する符号化方式です。符号化文字集合の切り替えにはエスケープシーケンスを用います。エスケープシーケンスは下記のとおりです。

なお、ASCIIのかわりにJIS X 0201ラテン文字集合(1b 28 4a)、および、JIS X 0208の1978年版(1b 24 40)のエスケープシーケンスもありますが、今日では積極的に用いることはないでしょう。

JIS X 0213との関係

JIS X 0213では、対応する符号化方式としてISO-2022-JP-2004が定義されています。JIS X 0213漢字集合1面漢字集合2面を指示するエスケープシーケンスが導入されます。

JISコード」との関係

ISO-2022-JPが俗に「JISコード」と呼ばれることがあります。これは半分は正しいが半分は誤解に基づいているといえます。

計算によって変形を施したシフトJISMSBを立てたEUCとは違って、JIS X 0208の7ビットのコード値そのままを使っているという意味で「JISコード」というのは合っています。ですが、エスケープシーケンスによって特定の種類の符号化文字集合を切り替えて使うという運用方式全体については、「JISコード」ではなく(それは元来JIS X 0208の規定のスコープ外なので)、ISO-2022-JPだということになります。

バリエーション

エスケープシーケンスによって7ビットの範囲にASCIIや2バイト符号化文字集合を切り替えて用いるというISO-2022-JPの発想は、応用されていくつかのバリエーションを生んでいます。

このリストは網羅的ではなく、また順不同です。これらには用いる制御コードなどにいくつか元のISO-2022-JPにない方式を含むものがあります。

関連項目

最終更新時間:2016年11月03日 16時20分51秒