トップ 新規 編集 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

JIS X 0213

[カテゴリ:仕様]

JIS X 0213は、日本の文字コード規格です。名称を「7ビット及び8ビットの2バイト情報交換用符号化拡張漢字集合」といいます。日本の漢字を含む2バイトコード規格のうち、日本のテキストの符号化に最も適したものです。

漢字平仮名片仮名、アルファベット、記号類など、11,233文字のコードを定義しています。制定年や改正年をとって、JIS2000やJIS2004とも呼ばれます。

符号化文字集合の概要

JIS X 0208の上位互換として設計されています。ISO/IEC 2022に整合的な形の、漢字集合1面漢字集合2面という2つの2バイト符号化文字集合が定義されています。

このうち漢字集合1面JIS X 0208の上位互換です。かな文字や符号付きアルファベット、丸付き数字や記号類といった非漢字、それに比較的使用頻度の高い第3水準漢字が追加されています。漢字集合2面にはより使用頻度の少ない第4水準漢字が含まれています。

追加すべき文字の選定にあたっては学校の教科書も全数調査され、学術用語として学校教科書に載っていながらJIS X 0208には無かった漢字も、JIS X 0213でカバーされました。小学3年生で学習する日本語のローマ字綴りに用いられる長音符号付きの母音字は、JIS X 0208にはありませんでしたがJIS X 0213で対応しました。

その他、文字レパートリーの概要については、漢字集合1面漢字集合2面の項をそれぞれ参照してください。

符号化方式の概要

ASCIIなど他の符号化文字集合と合わせた運用方式、いわゆる文字符号化方式について、JIS X 0213は、シフトJISやEUCといった、JIS X 0208の全ての符号化方式に対応しています。

規格本体に6種類を規定しているほか、附属書にて、下記の符号化方式を定義しています。

それぞれ、JIS X 0208におけるShift_JIS, ISO-2022-JP, EUC-JPに対応する符号化方式(おおまかに言ってこれらの拡張版)です。

規格本体で規定される6種類の符号化方式は下記の通りです。これらはJIS X 0208:1997から踏襲されています。

実装水準

上記の符号化方式には、それぞれ、実装水準3、実装水準4というふたつの実装水準が設けられています。実装水準3は、漢字集合2面に対応しない実装であり、実装水準4は漢字集合1面漢字集合2面の両方に対応した完全版の実装です。実装水準3の場合は漢字は第1水準から第3水準までの対応で、一方実装水準4では第1水準から第4水準漢字まで全ての対応となります。

このような実装水準が設けられているのは、漢字集合2面の対応には、従来のJIS X 0208だけの実装には用いられなかった機構が要ることがあるためです。例えばEUCの場合ならシングルシフト3による対応が必要になりますし、SJISなら漢字集合2面は区点番号との計算方法が漢字集合1面のものとは異なります。

従来のJIS X 0208対応の実装に対して最小限の変更で済ませられるような簡易な適合性として実装水準3が用意されています。

UnicodeないしISO/IEC 10646との関係

JIS X 0213はその各文字について、Unicode (ISO/IEC 10646 UCS) の対応する文字名符号位置を定めています。これに基づいて、Unicodeとの間でコード変換ができます。

JIS X 0213が2000年に制定された当初はUnicodeにない文字もありましたが、その後Unicode 3.2でJIS X 0213の全ての文字に対応しました。

ただし、Unicodeでは結合文字を使って複数の符号位置の並びとして表現する必要のある文字もあります。例えば鼻濁音表記用の平仮名片仮名や、アイヌ語表記用の片仮名の一部がこれに当たります。

また、漢字の一部がCJK互換漢字による対応になっています。これらはUnicode正規化の処理によってCJK統合漢字に置き換えられてしまいます。例えば「福」のへんが「ネ」でなく「示」の字体(面区点1-89-33、第3水準)がこれに当たります。

制定・改正履歴

  • 2000年 制定。
  • 2004年 改正。追補1を発行。例示字形を表外漢字字体表に合わせる変更。これに伴い第3水準漢字に「表外漢字UCS互換」10文字を追加。
  • 2012年 改正。追補2を発行。2010年に改正された常用漢字表との対応を参考情報として追加。

他の規格との関係

参考

最終更新時間:2017年04月23日 18時11分20秒