文字名
[カテゴリ:仕様]
概要
文字名とは、ISO/IEC 10646ならびにUnicodeにおいて各文字(符号位置)に与えられた名前です。ラテン大文字で付けられています。
例えば、ラテン文字の大文字A (U+0041)に対しては、「LATIN CAPITAL LETTER A」という名前が付けられています。平仮名の「あ」(U+3042)は「HIRAGANA LETTER A」です。
記号類や空白、制御コードの類にも与えられています。「.」(U+0046)の文字名は「FULL STOP」。ASCIIのハイフンにもマイナスにも使われる「-」(U+002D)は「HYPHEN-MINUS」です。
漢字については、U+4E00にある漢字「一」の文字名が「CJK UNIFIED IDEOGRAPH-4E00」となっているように、符号位置によって識別するようになっています。
規格間の対応付け
文字名は単にUnicodeの符号位置の別名であるだけでなく、コード変換表の役割も果たしています。
1990年代以降、ISO/IEC 10646以外の文字コード規格も、各文字について上記のような文字名を与えるようになっています。2000年に制定されたJIS X 0213はもちろんの事、10646以前に制定された文字コード規格、例えばJIS X 0201やJIS X 0208は、1990年代の改正時に文字名を定義しています。国際標準のISO/IEC 646やISO/IEC 8859-1も各文字に10646に対応する文字名を定義しています。
例えば、JIS X 0201はラテン文字集合の符号位置4/1のラテン大文字Aについて文字名「LATIN CAPITAL LETTER A」であると規定しています。これはUnicodeの符号位置U+0041にあたります。また、JIS X 0208は区点位置1-29にあるダッシュ記号について、文字名「EM DASH」であると規定しています。Unicodeの符号位置U+2014にあたります。
これにより、既存の文字コード規格とUnicodeならびにISO/IEC 10646との間で文字の対応付けがなされています。
関連項目
参考
- JIS X 0213のコード対応表 - 当サイト。JISとUnicodeの対応する符号位置に、その文字名も記されています。
最終更新時間:2016年11月18日 19時48分09秒