包摂
[カテゴリ:仕様]
文字コードにおいて包摂(ほうせつ)とは、ひとつの符号位置に複数の字体が対応することです。英語ではunificationといいます。
例えば、「逢」という字のしんにょうの点の数は1つでも2つでもあり得ますが、JIS X 0213やUnicodeといった文字コードではこうした1点しんにょう・2点しんにょうの字体を区別せずに同じ符号位置に対応させます。JIS X 0213なら1-16-9、UnicodeならU+9022です。
漢字には字体の様々な揺れがありますが、包摂規準を参照することによって、その文字集合がどのような差を区別するか・しないかを確かめることができます。包摂という概念は漢字に限定されません。例えば算用数字の「4」や「7」にはストロークの接触や有無による字体差がありますが、常識的に誰でも分かるためわざわざ包摂規準を明示する必要がありません。それに比べて漢字は数が多く複雑なため、包摂規準を明示することが文字集合の体系としての理解のために有益です。
なお、誤解した説明がたまに見受けられますが、文字コードの包摂とは「ある符号位置が複数の字体を包摂する」のであって、「ある字体Aが別の字体Bを包摂する」のではありません。一般的に、ある符号位置に包摂される複数の字体間にいずれかの字体が優先されるといった関係はありません。
JIS X 0208の包摂規準
JIS X 0208は1997年改正で初めて規格内に明示的に包摂規準を規定しました。186の規準が定義されています。これは全く何もないところからいきなり作られたわけではなく、過去の版の規格の「解説」に記載されていた包摂の例や、文字集合自体に内在する字体認識つまりどのような違いに対して別区点を割り当てているかといったことを考慮して定義されています。
ただし通常の包摂規準とは別に、83JISにおいて字体の大きく変えられた29の符号位置について、元の78JIS字体でも規格適合とするための救済用として特殊な包摂規準が設けられています(JIS X 0208:1997 6.6.4節)。例えば、18区10点の「鴎」は、78JISではへんが「區」であったのが83JISで変えられたものです。これは他の区点位置の例に照らせば本来JIS X 0208では包摂され得ない違いであることが分かりますが、83JISが不適当な字体変更をしてしまったため、特例として、旧規格の実装を規格適合とするためにこの2つの字体を包摂しています。
JIS X 0213の包摂規準
JIS X 0213はJIS X 0208の包摂規準を受け継ぎ、さらに13の規準を追加し199規準を設けています。
上記83JISの字体変更による特例の包摂規準は、JIS X 0213では削除されています。該当する29区点位置に対応する78JIS字体は、JIS X 0213において独立した区点位置が与えられたためです。例えば、上記「鴎」(1-18-10)の78JIS字体、つまりへんを「區」にしたものは、第3水準漢字として面区点位置1-94-69に配置されました。
ISO/IEC 10646の包摂規準
ISO/IEC 10646はJIS X 0213ほど詳細な包摂規準を規定してはいませんが、CJK統合漢字においてどのような差異を統合(包摂)したかを説明している箇所があります(Annex S)。例えば上記のしんにょうの1点・2点が包摂対象となることがそこから分かります。
最終更新時間:2017年09月11日 17時03分00秒