トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

JIS X 0201

[カテゴリ:仕様]

JIS X 0201は、日本の文字コード規格で、ASCIIに類似した1バイトコードを定めるものです。ISO/IEC 2022に整合的なコードです。標題を「7ビット及び8ビットの情報交換用符号化文字集合」といいます。1969年に制定されました。最新版は1997年改正のものです。

符号化文字集合の概要

ラテン文字集合、片仮名集合という2つの符号化文字集合を定義しています。これら2つは組み合わせて、あるいは単独で用いることができます。

組み合わせる場合は、制御文字SI/SOで符号化文字集合を切り替える7ビットの符号か、あるいはGL領域にラテン文字集合、GR領域に片仮名集合を割り当てる8ビットの符号として用います。

ラテン文字集合

ラテン文字集合はASCIIならびにISO/IEC 646国際基準版とほぼ同じですが、2文字のみ異なります。符号位置5/12 (0x5C)がバックスラッシュでなく円記号、7/14 (0x7E)がチルダでなくオーバーラインと定められています。ただし、7/14の実現字形としてはチルダの形も認められています。ラテン文字集合はJIS版のASCIIとみなせることから「JISCII」という呼ばれ方もしてきました。

片仮名集合

片仮名集合は俗に「半角片仮名」と呼ばれることもある1バイトのコードです。ただ、JIS X 0201は文字幅が半角であることを規定するものではありません。JIS X 0201の規格票の例示字形も半角幅で印刷されてはいません。この規格に限りませんが、文字幅はフォントや出力機器次第です。文字コードについて「半角片仮名」や「半角英数字」というのは誤解を招く表現です(全角・半角というのは印刷における印字幅を表す用語であり、文字の符号化とは無関係)。

JIS X 0201片仮名集合においては、濁点半濁点の付いた片仮名には独立した符号位置が与えられていません。濁点半濁点それ自体に対応する符号位置があるので、例えば「ガ」を表すには「カ」「゛」という2文字の列として表す必要があります。なおこの濁点半濁点Unicodeにあるような合成用の文字ではなく、前進を伴う文字とされています。

JIS X 0213との関係

JIS X 0213の規格では、JIS X 0213JIS X 0201ラテン文字集合と組み合わせて用いる符号化方式も定義されています。

JIS X 0213JIS X 0201の文字を全て含んでいます。JIS X 0208も多くを含んでいますが、アポストロフィ、二重引用符(開き・閉じの区別のないもの)、ハイフンマイナスはありませんでした。

他のコードとの関係

シフトJIS

JIS X 0201の8ビット符号(GLにラテン文字集合、GRに片仮名集合を呼び出した状態)は、Shift_JISならびにShift_JIS-2004のベースとなっています。

ISO-2022-JP

インターネットの電子メールに用いられてきたISO-2022-JPでは、エスケープシーケンスによってJIS X 0201ラテン文字集合を指示して用いることができます。バイト列「1b 28 4a」が出現するとそこから先はJIS X 0201ラテン文字集合として解釈されます。ただ、通常はASCIIを使えばいいので、実際に用いる必要性は (少なくとも今日では) 小さいでしょう。

なおISO-2022-JPではJIS X 0201片仮名集合は用いるようになっていません。片仮名JIS X 0208にあるのでJIS X 0201片仮名集合は不要なためです。一般に言う「メールに『半角片仮名』は使えない」というのはこれによります。

Unicode (ISO/IEC 10646)

JIS X 0201の規格内に、各文字のUnicode (ISO/IEC 10646 UCS)との対応する文字名が規定されています。これに従ってコード変換ができます。例えば、数字の「9」には DIGIT NINE、片仮名の「ア」には KATAKANA LETTER A と記されています。(JIS X 0201:1997の表1、表2を参照のこと)

参照情報

JIS X 0201のコード表は、ISO-IRの文書で参照できます。(ラテン文字集合片仮名集合。なお、このリンク先では旧規格番号でJIS C 6220と記載されています)

規格票はJSA Webdeskで購入できます。

関連項目

最終更新時間:2024年03月03日 15時34分57秒