エスケープシーケンス
[カテゴリ:仕様]
文字コードにおいてエスケープシーケンスとは、制御文字エスケープ (0x1B) とその後に続く何バイトかの列のことです。文字コードの構造と拡張法を定める国際規格ISO/IEC 2022において、符号化文字集合の切り替えに用いられます。
ISO/IEC 2022とエスケープシーケンス
ISO/IEC 2022の枠組みにおいては、用いる符号化文字集合を指定するのに、まずG0からG3までのいずれかのバッファに符号化文字集合を指示(designate)して、それをさらに8ビット符号表のGL領域(0x20-0x7F)やGR領域(0xA0-0xFF)へ呼び出す(invoke)という2段階を踏みます。ここで指示のためにエスケープシーケンスが用いられます。
ただしISO/IEC 2022の利用の実際には、指示と呼び出しという両方の操作を常に伴うわけではありません。G0をGLに呼び出す状態を固定しておいてエスケープシーケンスによる指示だけで切り替えを行っているとみなせる運用方式や (ISO-2022-JP, ISO-2022-JP-2004)、逆にG0からG3までの指示を予め行ったものとみなして固定し、エスケープシーケンスを一切用いない運用 (EUC-JP, EUC-JIS-2004) もあります。
主なエスケープシーケンス
日本語テキストに用いられる符号化文字集合をG0に指示するエスケープシーケンスの一覧を示します。
符号化文字集合 | 16進表現 | 文字列表現 [*1] |
---|---|---|
JIS C 6226-1978 | 1B 24 40 | ESC $ @ |
JIS X 0208-1983 | 1B 24 42 | ESC $ B |
JIS X 0208-1990 | 1B 26 40 1B 24 42 | ESC & @ ESC $ B |
JIS X 0212-1990 | 1B 24 28 44 | ESC $ ( D |
JIS X 0213:2000 漢字集合1面 | 1B 24 28 4F | ESC $ ( O |
JIS X 0213:2004 漢字集合1面 | 1B 24 28 51 | ESC $ ( Q |
JIS X 0213:2000 漢字集合2面 | 1B 24 28 50 | ESC $ ( P |
JIS X 0201ラテン文字集合 | 1B 28 4A | ESC ( J |
JIS X 0201片仮名集合 | 1B 28 49 | ESC ( I |
ASCIIないしISO/IEC 646国際基準版 | 1B 28 42 | ESC ( B |
参照
- ISO-IRのサイト - 国際登録簿に登録されている符号化文字集合のエスケープシーケンスならびに符号表があります。
関連項目
- ISO/IEC 2022
- ISO-2022-JP - エスケープシーケンスによって符号化文字集合を切り替える符号化方式
- ISO-2022-JP-2004 - 上記のJIS X 0213対応版
最終更新時間:2023年07月07日 00時25分15秒