トップ 新規 編集 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

JIS X 0208

[カテゴリ:仕様]

概要

JIS X 0208は、日本の文字コード規格で、JIS X 0213の元になったものです。規格名称を「7ビット及び8ビットの2バイト情報交換用符号化漢字集合」といいます。

ISO/IEC 2022に整合的な94×94文字の2バイト符号化文字集合として設計されています。漢字をはじめ、平仮名片仮名ラテン文字ギリシャ文字キリル文字、数字、記号類を含む6,879文字のコードを定めています。

1978年の制定以降、日本語に対応する情報機器において極めて広く利用されてきました。ただし、漢字においても漢字以外においても文字が足りない、現代日本のテキストを符号化するのに不十分であるという問題があり、拡張規格のJIS X 0213の制定につながりました。

制定・改訂履歴

  • 1978年: 初版制定。(当初の規格番号はC6226)
  • 1983年: 改正。記号類の追加のほか、一部の漢字の符号位置の入れ替え、字体の簡略化。
  • 1990年: 改正。漢字を2文字追加。
  • 1997年: 改正。コード表には変更を加えず、符号位置に対応する文字の明確化や漢字の典拠調査を行う大規模な改正。包摂規準の明確化、シフトJISの規定、文字名の規定(Unicodeとの変換表に相当)等。
  • 2012年: 改正。2010年の常用漢字改正による参考情報の更新。技術的な変更はなし。

符号化方式

運用方法(いわゆる文字符号化方式)として、JIS X 0208を単体で用いる方式(すなわち2バイト固定長)のほか、JIS X 0201ならびにISO/IEC 646国際基準版(ASCIIと同等)と同時に用いる方式(すなわち1バイトと2バイトが混在)を定義しています。また、附属書においてシフトJISとISO-2022-JP (RFC1468)を取り込んでいます。

よく利用される符号化方式として下記の3つがあります。

JIS X 0213との関係

上記の符号化方式それぞれに対応して、JIS X 0213では、Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004という拡張版が用意されています。

JIS X 0213JIS X 0208:1997がベースになっています。

JIS X 0213漢字集合1面は、JIS X 0208の上位互換として設計されています。

Unicode (ISO/IEC 10646 UCS)との関係

JIS X 0208UnicodeCJK統合漢字を最初に作る際に参照された原規格のひとつです。

JIS X 0208の各文字に対応するUnicodeの文字は、JIS X 0208の規格の中に、ISO/IEC 10646 UCS (Unicodeと同じ)の文字名を参照する形で規定されています。これに従ってUnicodeとの間でコード変換ができます。この方法はJIS X 0201やISO/IEC 646、ISO/IEC 8859等と同じです。

機械可読な変換表は、JIS X 0213とUnicodeのコード変換表が使えます。JIS X 0213JIS X 0208の上位互換なので、ここにある対応表の中からJIS X 0213で追加された文字 ([2000]及び[2004] とマークされた行) を読み飛ばすと、JIS X 0208の変換表として使えます。

なお、いわゆる「CP932」などのベンダ実装の変換表は、UnicodeとJISの対応関係に誤りが幾つかあるので不適切です。例えば、JISの波ダッシュ(文字名WAVE DASH、SJIS 0x8160)はUnicodeのU+301C (文字名WAVE DASH)に変換するのが正しいですが、「CP932」と呼ばれるものでは、誤ってU+FF5E (FULLWIDTH TILDE。EUC-JP等のチルダを重複符号化した文字コードとの間の往復変換のための救済用の符号位置)に対応づける実装が存在します。このような実装は文字化けの元になっており、波ダッシュ問題として知られています。

参照情報

JIS X 0208のコード表は、ISO-IRのサイトでPDFファイルを参照できます(番号168)。

規格票はJSA Web Storeで購入できます。

参考

関連項目

最終更新時間:2016年11月20日 08時54分46秒