CJK互換漢字
[カテゴリ:仕様]
CJK互換漢字とは、UnicodeならびにISO/IEC 10646において、CJK統合漢字とは別に、他の文字コードとの互換性のために用意されている漢字の符号位置です。
CJK互換漢字にはいくつかの由来があります。例えば、韓国KS X 1001における重複符号化された漢字や、JIS X 0213や台湾の漢字コード規格CNS 11643におけるCJK統合漢字で包摂される字体などです。前者KS規格における重複符号化は同じ漢字を発音の違いによって複数の異なる符号位置へ配置したもので、図形文字としてはKS規格においても本質的に同一のものですが、一方JISやCNSのものは図形文字として区別されるべきものとして定義されています。異なる性質のものですが「互換」という名目で一緒に扱われています。
JIS X 0213とCJK互換漢字
JIS X 0213ではJIS X 0208で包摂されていた字体のうち、人名用漢字として許容されている字体や、常用漢字表で過去の字体とのつながりを示すために掲示されている所謂康熙字典体を、意図的に別区点に割り当てています(人名許容・康熙別掲)。
JIS X 0213の文字がUnicodeに追加された際、これらの漢字のうちいくつかは、Unicodeでは、CJK統合漢字に既に包摂されている字体であるとして、独立した符号位置を与えられませんでした。しかしそれではJIS X 0213とのコード変換に問題を生じることから、互換漢字の符号位置が割り当てられています。互換漢字の符号位置はBMPでは U+FAxx のような位置にあるので、符号位置によってCJK統合漢字との見分けがつきます。(なおBMPだけでなく面02にもCNS規格用のCJK互換漢字が用意されています)
互換漢字の問題
CJK互換漢字はUnicode正規化の操作によって対応するCJK統合漢字に置き換えられてしまいます。これは、4つある正規化形式のいずれでも同じです。
したがって、例えば、JIS X 0213で追加された「示へんの形が『示』の『神』」(JIS第3水準、面区点 1-89-28、U+FA19)が、Unicode正規化によって「『ネ』の『神』」(第1水準、1-31-32、U+795E)に変わってしまうことになります。
最終更新時間:2017年04月08日 23時06分30秒