トップ 一覧 検索 ヘルプ RSS ログイン

符号化文字集合の変更点

-これはISO/IEC 646やISO/IEC 8859といった国際規格における定義と同等の内容です。例えば[[ISO/IEC 646]]:1991では下記のように定義されています。ASCIIを定めるANSI X3.4でも同じです。
+これは[[ISO/IEC 646]]や[[ISO/IEC 8859]]といった国際規格における定義と同等の内容です。例えば[[ISO/IEC 646]]:1991では下記のように定義されています。ASCIIを定めるANSI X3.4でも同じです。
+「符号 (code)」という言葉が「符号化文字集合」と同じとして定義されていることから、一般的にいう「文字コード」も「符号化文字集合」と同じとみなして用いることができます。
+
+ただ、「コード」という言葉は、ここで定義されているような体系のことを指すこともあれば、コードによって定義される個々の値のことを指すこともあります。それが紛らわしいときは、前者を「コード系」、後者を「コード値」のように言って区別することができます。
+
+
+!!符号化文字集合についての誤解
+
+符号化文字集合を、符号化表現を与えられていない単なる文字の集合とした解説がたまにありますが、上記JISやISOの定義からも分かるとおり、これは誤解です。
+
+集合の各要素(文字)に符号化表現が与えられているからこそ「符号化文字集合」と呼ばれるのであって、そうでなければただの「文字集合」です。符号化されていない文字集合としては、例えば、常用漢字表や、平仮名の集合 (「いろは」47文字など)、ラテンアルファベット26文字の集合、などを挙げることができます。
+
+また、文字コードを定めるJISやISO以外の業界団体の発行する文書には、符号化文字集合を文字と整数の対応付けと記したものがありますが、これも不適当です。JISやISO, ANSI (ASCII)といった世界の文字コード標準では上に引用したように文字とビット組合せの対応付けとして定義されています。ビット組合せは2進法の整数と解釈することができますが、その方法は一通りではありません(1の補数、2の補数など)。
+
+!!参考
+
+* ISO/IEC 646, ISO/IEC 8859-1, JIS X 0208, JIS X 0213等の符号化文字集合規格の用語定義
+* [プログラマのための文字コード技術入門|https://www.amazon.co.jp/gp/product/477414164X/ref=as_li_tf_tl?ie=UTF8&camp=247&creative=1211&creativeASIN=477414164X&linkCode=as2&tag=x0213-22] 第1章