[Project X0213][English version]

常用漢字と文字コードの対応表

2010年に改定された常用漢字表の2,136文字についての、文字コード(JIS X 0213、Unicode)との対応表を、機械可読なCSV形式で用意しました。

文字コードとしては、JIS X 0213の面区点番号、7ビットコード(GL)、 EUC-JIS-2004のコード(GR)、SJISコード(Shift_JIS-2004)、および、 ISO/IEC 10646 UCS (Unicode)の符号位置のそれぞれについて記しています。

ダウンロード: (下の3つのリンクは同一の内容で、ファイルの文字コードだけが違います)

この対応表は第3水準漢字を含んでいます。したがって、JIS第3・第4水準に対応した環境でご利用ください。また、UnicodeにおいてBMPでなく面02に属する文字を含んでいます。UTF-8においては4バイトのUTF-8、UTF-16においてはサロゲート・ペアへの対応が必要です。

含まれる第3水準漢字は、1-15-56 (塡)、1-15-94 (剝)、1-47-52 (𠮟)、 1-93-90 (頰)の4文字です。また、Unicodeで面02に属するのは、1-47-52 (𠮟、U+20B9F) です。

対応表の中に誤りを発見された場合、JIS X 0213メーリングリストか、JIS X 0213 Wiki相談所までご一報いただけると幸いです。

常用漢字表は、「法令、公用文書、新聞、雑誌、放送など、一般の社会生活において、現代の国語を書き表す場合の漢字使用の目安を示す」(同表「前書き」)ものとされています。また、子供の名付けに使うこともできます。子の名付けに使える漢字は、常用漢字表と人名用漢字表に掲げられているものです。

参考資料:


広告

2012年7月1日 初版公開、2012年9月30日 説明更新
© 2012 Project X0213