検索
- ISO/IEC 2022 -
EUC-JIS-2004などの各種EUC方式や[[ISO/IEC 8859-1]]などもこれを行っているものと
- ISO/IEC 8859 -
最もよく知られている部は、西ヨーロッパ諸言語向けの第1部、すなわち[[ISO/IEC 8859-1]]、通称Latin-1です。
- ISO/IEC 8859-1 - ISO/IEC 8859-1
- ISO/IEC 8859-2 -
[[ISO/IEC 8859-1]]といくつかの文字が共通しています。それらの文字は、8859-1と同じ符号位置に割り当てられています。
- MSB -
一方、ASCIIを拡張した形をとる[[ISO/IEC 8859-1]] (Latin-1)では、0xA0-0xFFの領域(GR領域)に文字を割り当てており、ここはMSBが1となります。
- Unicode正規化 -
前者は例えば[[ISO/IEC 8859-1]]に見られます。同規格にはa, e, oなどのアルファベットに対して、アキュートアクセントやウムラウト、サーカムフレックス等のダイアクリティカルマークがついた文字が収録されています。Unicodeはこれらをそのまま収録してもいますが、一方で、後者の考え方による合成用のダイアクリティカルマークも用意しており、基底文字(通常のアルファベット)に結合文字を後置することで、記号のついた文字を表現します。
- ソフトハイフン -
!!ISO/IEC 8859-1におけるソフトハイフン
- ダイアクリティカルマーク -
JIS X 0213は、西欧諸言語で用いられるものを中心に、ダイアクリティカルマークつきのアルファベットを収録しています。特に、[[ISO/IEC 8859-1]]と[[ISO/IEC 8859-2]]にある文字は全て入っています。
- ノーブレークスペース -
!!ISO/IEC 8859-1におけるノーブレークスペース
- ラテン文字 -
* [[ISO/IEC 8859-1]] - ISO/IEC 646国際基準版に加え、フランス語ドイツ語スペイン語等の西欧諸言語で用いられるダイアクリティカルマーク付きなどの文字を収めています。
- 円記号 -
!!ISO/IEC 8859-1における円記号
- 漢字集合1面 -
**アクセント記号などダイアクリティカルマーク付きのラテン文字。フランス語やドイツ語等欧州言語で使われるものや、日本語のローマ字表記で長音を表すものなど。特に、西欧の[[ISO/IEC 8859-1]]、中欧の[[ISO/IEC 8859-2]]の文字は全て含む
- 符号化文字集合 -
* ISO/IEC 646, ISO/IEC 8859-1, JIS X 0208, JIS X 0213等の符号化文字集合規格の用語定義
- 文字コード -
ひとつめの意味は、例えば「ASCII」や「[[ISO/IEC 8859-1]]」、「Shift_JIS-2004」などが該当します(IETFの語法で「文字符号化方式」に当たるものも含みます)。ISOやJISの定義で「符号 (code)」という語は「符号化文字集合」と同義なので、「文字コード」という広く知られている言葉を「符号化文字集合」と対応させて用いることができます。
- 文字名 -
1990年代以降、[[ISO/IEC 10646]]以外の文字コード規格も、各文字について上記のような文字名を与えるようになっています。2000年に制定されたJIS X 0213はもちろんの事、10646以前に制定された文字コード規格、例えばJIS X 0201やJIS X 0208は、1990年代の改正時に文字名を定義しています。国際標準の[[ISO/IEC 646]]や[[ISO/IEC 8859-1]]も各文字に10646に対応する文字名を定義しています。