検索
- CJK互換漢字 -
CJK互換漢字はUnicode正規化の操作によって対応するCJK統合漢字に置き換えられてしまいます。これは、4つある正規化形式のいずれでも同じです。
- JIS X 0213 -
また、漢字の一部がCJK互換漢字による対応になっています。これらはUnicode正規化の処理によってCJK統合漢字に置き換えられてしまいます。例えば「福」のへんが「ネ」でなく「示」の字体(面区点1-89-33、第3水準)がこれに当たります。
- Unicode -
これは、Unicode正規化の処理を適用すると、対応するCJK統合漢字に移されてしまいます。
- Unicode正規化 - Unicode正規化
- ローマ数字 -
ただし、Unicode正規化処理のNFKC, NFKDによって、例えば「III」(を1文字にした符号位置)が「ラテン大文字のIの三つの並び」になるなどします。
- 人名用漢字 -
上記のようにJIS X 0213で分離された人名用漢字は、UnicodeではCJK互換漢字という扱いで追加されているものが多くあります。CJK互換漢字は、Unicode正規化の処理を実行すると、対応するCJK統合漢字に変換されてしまいます。
- 濁点 -
1文字に複数の符号化方法があることは重複符号化になってしまうので、いずれかの方式に揃えることができます。これをUnicode正規化といいます。
- 半濁点 -
1文字に複数の符号化方法があることは重複符号化になってしまうので、いずれかの方式に揃えることができます。これをUnicode正規化といいます。