ISO/IEC 8859-1
[カテゴリ:仕様]
概要
ISO/IEC 8859-1は、ISOとIECによる文字コードの国際規格で、西ヨーロッパの諸言語の表記に使われるラテン文字を符号化するものです。ISO/IEC 8859という規格の第1部です。通称としてLatin-1ともいいます。最新版は1998年に発行されています。
標題を「Information technology - 8-bit single-byte coded graphic character sets - Part 1: Latin alphabet No. 1」と言います。
符号の構造
ISO/IEC 2022と整合的な1バイト符号化文字集合として定義されています。8ビット符号表のGL領域(0x20-0x7F)にISO/IEC 646国際基準版(ASCIIと同じ)、GR領域(0xA0-0xFF)にはこの規格が定める文字集合を置いた形で使われます。
0xA0と0xFFにも図形文字を割り当てている96文字集合です。したがって、ISO/IEC 2022でG0へ指示することはできません。(GLへの呼び出しは可能なことに注意。ISO-2022-JP-2はLatin-1をG2経由でGLに呼び出す)
文字レパートリー
ASCIIには入っていない、アクセントやウムラウトなどのダイアクリティカルマーク付きのラテン文字が収められています。例えばフランス語の表記に用いられるアキュートアクセント(アクサン)付きのeや、ドイツ語の表記に用いられるウムラウト付きのa、ポルトガル語の表記に用いられるチルダ付きのaなどです。アクサンシルコンフレクスの付いた母音字aiueoがひとそろいはいっているので、日本語のローマ字表記にも使えます。ダイアクリティカルマークのつかない文字としては、ドイツ語に用いられるエスツェットや、フランス語・デンマーク語などに用いられるaeの合字などがあります。
また、記号類も入っています。数式の乗算・除算の記号や、著作権表示記号、通貨のポンド記号、円記号などがあります。ただし、ユーロ導入前に成立した文字コードであるため、ユーロ記号は入っていません。ISO/IEC 8859の第15部として、ユーロ記号を含めた西欧言語向けの文字コードが定義されています。
特殊な符号として、ノーブレークスペース(NBSP)とソフトハイフン(SHY)があります。前者は、その位置で改行を許さないようなスペース、後者は、単語の中で改行可能な位置を示し、その位置で改行するときにだけ図形として表示されるハイフンです。
JIS X 0213との関係
JIS X 0213はISO/IEC 8859-1の文字を全て含んでいます。
ただし、符号位置11/05のマイクロ記号は、既に存在するギリシャ文字ミュー(μ)との重複符号化になるため別区点を与えてはいません。
UnicodeならびにISO/IEC 10646との関係
UnicodeならびにISO/IEC 10646は、ISO/IEC 8859-1の文字を並びも含めてそっくりコピーしています。U+00A0からU+00FFまでがISO/IEC 8859-1の右半分にあたります。
ISO/IEC 8859-1は各文字について、ISO/IEC 10646に対応する文字名を定義しています。
参照情報
正式な規格票はJSA Webdeskで購入できます。
最終更新時間:2023年04月25日 21時03分52秒