検索
- EUC -
[[ISO/IEC 2022]]に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。
- EUC-JP -
8ビット符号表に下記のように符号化文字集合を割り当てたものです。
- ISO-2022-JP -
7ビットのみを用いる、1バイト文字集合と2バイト文字集合を切り替えて使用する符号化方式です。符号化文字集合の切り替えにはエスケープシーケンスを用います。エスケープシーケンスは下記のとおりです。
- ISO-2022-JP-2004 -
7ビットのみを用いる、1バイト文字集合と2バイト文字集合を切り替えて使用する符号化方式です。符号化文字集合の切り替えにはエスケープシーケンスを用います。エスケープシーケンスは下記のとおりです。
- ISO/IEC 10646 -
日本では、技術的内容が同一である対応規格がJIS X 0221「国際符号化文字集合 (UCS)」として発行されています。こちらの最新版は2020年発行のもので、ISO/IEC 10646:2017およびその追補1:2017と追補2:2019に相当します。
- ISO/IEC 2022 -
ISO/IEC 2022は、文字コード(符号化文字集合)の構造と拡張法を定めるISOとIECによる国際規格です。
- ISO/IEC 646 -
* [[ISO/IEC 2022]]の枠組みの中でISO/IEC 646国際基準版を用いることができます。符号拡張法によって他の符号化文字集合と組み合わせて用いることができます。
- ISO/IEC 8859 -
第1部から第16部まであり(ただし第12部は欠番)、それぞれが別個の符号化文字集合を定義しています。他のISO規格やJISと同じく、部の番号は規格番号の後にハイフンで続けて記します。
- ISO/IEC 8859-1 -
[[ISO/IEC 2022]]と整合的な1バイト符号化文字集合として定義されています。
- ISO/IEC 8859-2 -
[[ISO/IEC 2022]]と整合的な1バイト符号化文字集合として定義されています。
- JIS X 0201 -
標題を「7ビット及び8ビットの情報交換用符号化文字集合」といいます。1969年に制定されました。最新版は1997年改正のものです。
- JIS X 0208 -
[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合として設計されています。
- JIS X 0212 -
[[ISO/IEC 2022]]に整合的な2バイト符号化文字集合です。従って、ISO/IEC 2022の枠組みに則って、JIS X 0208と組み合わせあるいは切り替えて用いることができます。例えば、EUC-JPではシングルシフトコードによってGRの文字集合をJIS X 0208と切り替えたり、ISO-2022-JP-2ではエスケープシーケンスによって指示して使うことができます。
- JIS X 0213 -
!!符号化文字集合の概要
- JIS X 0221 -
JIS X 0221は、[[ISO/IEC 10646]]と技術的内容が同一である日本の対応規格です。表題を「国際符号化文字集合 (UCS)」としています。
- JIS2004 -
JIS2004とは、符号化文字集合規格JIS X 0213の2004年改訂版の通称です。したがって、JIS2004の規定する内容についてはJIS X 0213の項を参照してください。
- JIS漢字 -
1番目の意味は規格本来の主旨、つまり文字とその符号化表現との対応である符号化文字集合を指します。
- Unicode -
Unicodeは、Unicodeコンソーシアムという業界団体が策定している文字コードの国際規格です。世界中の文字を単一の文字コード(符号化文字集合)で扱うことをねらいとしています。
- エスケープシーケンス -
文字コードにおいてエスケープシーケンスとは、制御文字エスケープ (0x1B) とその後に続く何バイトかの列のことです。文字コードの構造と拡張法を定める国際規格[[ISO/IEC 2022]]において、符号化文字集合の切り替えに用いられます。
- 円記号 -
ここに、双方の符号化文字集合に円記号が存在するため、同じ記号に対して符号化表現が2種類存在する重複符号化が発生しています。
- 漢字 -
JIS X 0213はJIS X 0208に足りない、現代日本で用いられている漢字を収録しています。JIS X 0208の第1水準・第2水準に加えて、第3水準・第4水準という2つの集合を追加しています。第3水準の方が頻度が高い文字を集めています。JIS X 0213の漢字集合1面・漢字集合2面というふたつの符号化文字集合のうち、第3水準漢字は前者に、第4水準漢字は後者に含まれます。
- 漢字集合1面 -
漢字集合1面とは、JIS X 0213で定義されている2つの符号化文字集合の1つです。8,797文字を収録しています。JIS X 0208の上位互換となっています。JIS X 0208の符号表の空き領域の大部分を文字で埋めたものです。
- 漢字集合2面 -
漢字集合2面とは、JIS X 0213で定義されている2つの符号化文字集合のうちの1つです。2,436文字を収録しています。JIS X 0213:2000において新たに設計されたものです。漢字集合1面はJIS X 0213の2004年改正で文字の追加がありましたが、2面には変更がありません。
- 表外漢字UCS互換 -
表外漢字UCS互換とは、JIS X 0213の2004年改正で第3水準漢字に追加された10文字です。ここでいうUCSとは[[ISO/IEC 10646]] UCS (Universal Coded Character Set, 国際符号化文字集合)のことです。JIS X 0213の例示字形を表外漢字字体表に合わせる際にUCSとの互換性の問題から設定されたものです。
- 符号位置 -
JIS X 0213では94×94の符号化文字集合を2つ定義しています。このうち漢字集合1面はJIS X 0208の上位互換、漢字集合2面は新たに定義された面です。
- 符号化文字集合 - 符号化文字集合
- 文字コード -
* 文字の集合を定めて、その集合内の各文字に符号化表現を与えたもの。ISOやJISの標準で定義される「符号化文字集合(coded character set)」に同じ
- 面区点番号 -
JIS X 0213においては、JIS X 0208同様の94×94の符号化文字集合が2面あるので(漢字集合1面・漢字集合2面)、区点番号の前に面番号をつけることで、どちらの漢字集合かを示します。したがって、面番号は1か2のいずれかです。また、区番号・点番号はもちろん1から94までの数字です。