トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

文字名

[カテゴリ:仕様]

概要

文字名とは、ISO/IEC 10646ならびにUnicodeにおいて各文字(符号位置)に与えられた名前です。ラテン大文字で付けられています。

例えば、ラテン文字の大文字A (U+0041)に対しては、「LATIN CAPITAL LETTER A」という名前が付けられています。平仮名の「あ」(U+3042)は「HIRAGANA LETTER A」です。

記号類や空白、制御コードの類にも与えられています。「.」(U+0046)の文字名は「FULL STOP」。ASCIIのハイフンにもマイナスにも使われる「-」(U+002D)は「HYPHEN-MINUS」(ハイフンマイナス)です。

漢字については、U+4E00にある漢字「一」の文字名が「CJK UNIFIED IDEOGRAPH-4E00」となっているように、符号位置によって識別するようになっています。

規格間の対応付け

文字名は単にUnicode符号位置の別名であるだけでなく、コード変換表の役割も果たしています。

1990年代以降、ISO/IEC 10646以外の文字コード規格も、各文字について上記のような文字名を与えるようになっています。2000年に制定されたJIS X 0213はもちろんの事、10646以前に制定された文字コード規格、例えばJIS X 0201JIS X 0208は、1990年代の改正時に文字名を定義しています。国際標準のISO/IEC 646ISO/IEC 8859-1も各文字に10646に対応する文字名を定義しています。

例えば、JIS X 0201ラテン文字集合の符号位置4/1のラテン大文字Aについて文字名「LATIN CAPITAL LETTER A」であると規定しています。これはUnicode符号位置U+0041にあたります。また、JIS X 0208は区点位置1-29にあるダッシュ記号について、文字名「EM DASH」であると規定しています。Unicode符号位置U+2014にあたります。

これにより、既存の文字コード規格とUnicodeならびにISO/IEC 10646との間で文字の対応付けがなされています。

関連項目

参考

最終更新時間:2023年07月16日 14時35分13秒