トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

漢字

[カテゴリ:文字]

漢字は、中国大陸発祥の文字で、現代では日本、中国、台湾等の言語表記に用いられます。

一文字が古代中国の単音節語の一語に対応することから表語文字と分類されます。表意文字と呼ばれることもあります。

漢字は数が多いことから、ASCIIJIS X 0201のような1バイトコードでは表すことができず、2バイトコードが実用化されることでコンピュータで扱えるようになりました。

JIS X 0208における漢字

JIS X 0208は日本で使われる漢字を集めています。第1水準・第2水準という2つの集合に分けられています。能力の低いかつてのPCでは、第1水準のみ対応というケースがありましたが、規格上はそのような部分実装を認められてはいませんでした。

JIS X 0208は日本で日常的に用いられる漢字をかなりの程度集めていました。一部地域のみで使われる特殊な地名漢字も収録していましたが、それでもなお専門用語や地名・人名などに用いられる字に不足がありました。

JIS X 0208を補完する規格としてJIS X 0212 (補助漢字)が策定されましたが、シフトJIS方式で符号化できないことや古典漢文に偏り必ずしも現代日本文のニーズに合致していない方針もあいまって普及せず、JIS X 0213の開発につながりました。

JIS X 0213における漢字

JIS X 0213JIS X 0208に足りない、現代日本で用いられている漢字を収録しています。JIS X 0208の第1水準・第2水準に加えて、第3水準・第4水準という2つの集合を追加しています。第3水準の方が頻度が高い文字を集めています。JIS X 0213漢字集合1面漢字集合2面というふたつの符号化文字集合のうち、第3水準漢字は前者に、第4水準漢字は後者に含まれます。

字種の選定には行政地名や人名の調査のみならず学校教科書の全数調査もされており、学術・文化の専門用語の文字に対応しています。現代日本の印刷物で安定的に用いられていることを示す用例の存在を重視しており、ある字書に掲載している文字を全部といった方針は採用していません。

JIS X 0213は2010年改正の常用漢字表の文字を全て含みます。また人名用漢字も全て含みます。

ISO/IEC 10646ならびにUnicodeにおける漢字

Unicodeは、日本・中国・韓国・台湾の漢字コード規格にある漢字を統合した文字集合を作っています。これがCJK統合漢字です。JIS X 0208はオリジナルのCJK統合漢字を作成する際に参照された原規格のひとつであり、JIS X 0208漢字を全て含みます。JIS X 0213が制定された後、当時Unicodeになかった漢字JIS X 0213を典拠としてUnicodeに追加されました。ただし一部の漢字CJK互換漢字としての対応になっています。

関連項目

最終更新時間:2017年04月26日 23時05分34秒