{{category 仕様}} 符号化文字集合とは、要するに文字コードのことです。文字とコードとの対応付けの 定義のことをいいます。この文脈における「コード」とは、ディジタルコンピュータを前提とすると 一般的に、ビットを組み合わせたバイト(列)を意味します。 !!規格における定義 JISでは下記のような定義がなされています。(JIS X 0213:2000より) ""符号化文字集合 (coded character set), 符号 (code) 文字集合を定め, かつその集合内の文字とビット組合せとを1対1に関係付ける, あいまいでない規則の集合。 これはISO/IEC 646やISO/IEC 8859といった国際規格における定義と同等の内容です。例えば[[ISO/IEC 646]]:1991では下記のように定義されています。ASCIIを定めるANSI X3.4でも同じです。 ""coded character set; code : A set of unambiguous rules that establishes a character set and the one-to-one relationship between the characters of the set and their bit combinations. !!JIS X 0213が定義する符号化文字集合 JIS X 0213では、漢字集合1面と漢字集合2面という2つの符号化文字集合を 定義しています。 2つ以上の符号化文字集合を組み合わせたものもまた、 上記の定義における符号化文字集合です。 JIS X 0213は「符号化文字集合」の節において、6種類の符号化文字集合を定義しています。 6種類の内訳は、 * JIS X 0213を単体で用いるか、またはISO/IEC 646国際基準版 (ASCIIと同等)あるいはJIS X 0201の1バイトコードと組み合わせて用いるか * 7ビットか8ビットか という2つの軸によって整理されます。(参考: 「[JIS X 0213のあまり代表的でないかもしれない符号化方式|http://www.asahi-net.or.jp/~wq6k-yn/code/enc-hontai.html]」) また、附属書1から3において、Shift_JIS-2004, ISO-2022-JP-2004, EUC-JIS-2004を定義していますが、これらも上記の定義における符号化文字集合です。 こうしたものは、IETFなどの非標準の文書では文字符号化方式とされることが しばしばありますが、用語の定義に違いによるものです。 !!関連項目 * [[ISO/IEC 2022]] - 符号化文字集合の構造と拡張法を定める国際標準。