トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

エスケープシーケンス

[カテゴリ:仕様]

文字コードにおいてエスケープシーケンスとは、制御文字エスケープ (0x1B) とその後に続く何バイトかの列のことです。文字コードの構造と拡張法を定める国際規格ISO/IEC 2022において、符号化文字集合の切り替えに用いられます。

ISO/IEC 2022とエスケープシーケンス

ISO/IEC 2022の枠組みにおいては、用いる符号化文字集合を指定するのに、まずG0からG3までのいずれかのバッファに符号化文字集合を指示(designate)して、それをさらに8ビット符号表のGL領域(0x20-0x7F)やGR領域(0xA0-0xFF)へ呼び出す(invoke)という2段階を踏みます。ここで指示のためにエスケープシーケンスが用いられます。

ただしISO/IEC 2022の利用の実際には、指示と呼び出しという両方の操作を常に伴うわけではありません。G0をGLに呼び出す状態を固定しておいてエスケープシーケンスによる指示だけで切り替えを行っているとみなせる運用方式や (ISO-2022-JP, ISO-2022-JP-2004)、逆にG0からG3までの指示を予め行ったものとみなして固定し、エスケープシーケンスを一切用いない運用 (EUC-JP, EUC-JIS-2004) もあります。

主なエスケープシーケンス

日本語テキストに用いられる符号化文字集合をG0に指示するエスケープシーケンスの一覧を示します。

符号化文字集合16進表現文字列表現 [*1]
JIS C 6226-19781B 24 40ESC $ @
JIS X 0208-19831B 24 42ESC $ B
JIS X 0208-19901B 26 40 1B 24 42ESC & @ ESC $ B
JIS X 0212-19901B 24 28 44ESC $ ( D
JIS X 0213:2000 漢字集合1面1B 24 28 4FESC $ ( O
JIS X 0213:2004 漢字集合1面1B 24 28 51ESC $ ( Q
JIS X 0213:2000 漢字集合2面1B 24 28 50ESC $ ( P
JIS X 0201ラテン文字集合1B 28 4AESC ( J
JIS X 0201片仮名集合1B 28 49ESC ( I
ASCIIないしISO/IEC 646国際基準版1B 28 42ESC ( B
  • [*1] 各バイトを便宜的にASCII (ISO/IEC 646 国際基準版)の文字で表したもの。 ただし "ESC" はバイト値0x1Bを表す。

参照

関連項目

最終更新時間:2023年07月07日 00時25分15秒