トップ 一覧 検索 ヘルプ RSS ログイン

検索

キーワード AND OR
  • ASCII - 国際規格である[[ISO/IEC 646]]の国際基準版は、ASCIIと同等の文字コードです。
  • BBS-相談所/3 - ISO-2022-JP-2004の対応表ですが、ISO/IEC 646 IRVと重複する文字も漢字7ビット符号の対応表と同様に割り当てるのではないですか?
  • BMP - BMP (Basic Multilingual Plane, 基本多言語面)は、Unicode並びに[[ISO/IEC 10646]]の面00に付けられた呼び名です。
  • CJK互換漢字 - CJK互換漢字とは、Unicodeならびに[[ISO/IEC 10646]]において、CJK統合漢字とは別に、他の文字コードとの互換性のために用意されている漢字の符号位置です。
  • CJK統合漢字 - CJK統合漢字とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて、東アジアの漢字文化圏各国の漢字コード規格にある漢字を統合して作成された漢字集合です。CJKという呼び方はChina, Japan, Koreaの頭文字から来ています。
  • EUC - [[ISO/IEC 2022]]に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。
  • EUC-JP - 0x8F, 0x8Eは[[ISO/IEC 2022]]で取り決められているシングルシフトの制御コードです。
  • GB 2312 - [[ISO/IEC 2022]]に準拠した構造をしています。GL領域にASCIIを、GR領域にこの2バイトコードを呼び出した格好のEUC-CNがよく使われます。
  • IEC - IEC
  • ISO - 文字コードの分野では、ASCII相当の[[ISO/IEC 646]]、文字コードの構造と拡張法を定める[[ISO/IEC 2022]]、欧州言語の文字の8ビットコード[[ISO/IEC 8859]]、国際符号化文字集合[[ISO/IEC 10646]]といった主要な規格をIEC (国際電気標準会議)とともに開発しています。
  • ISO-2022-JP - 名前が紛らわしいのですが、ISO-2022-JPはISOで定義されている文字コードではありません。[[ISO/IEC 2022]]の仕組みの一部を用いて日本の文字コードをASCIIとともに運用する一方式です。
  • ISO/IEC 10646 - ISO/IEC 10646
  • ISO/IEC 2022 - ISO/IEC 2022
  • ISO/IEC 646 - ISO/IEC 646
  • ISO/IEC 8859 - ISO/IEC 8859
  • ISO/IEC 8859-1 - ISO/IEC 8859-1
  • ISO/IEC 8859-2 - ISO/IEC 8859-2
  • JIS - 1995年以降、WTO/TBT協定によって、国内規格はISOやIECのような国際規格と整合性が取られるよう改訂されています。日本の文字コード規格はもともと国際規格 [[ISO/IEC 2022]] と整合するよう規定されてきましたが、1995年以降の改訂では、規格の標題や構成のような形式的な面からも整合が図られています。また、[[ISO/IEC 10646]]と技術的に一致する(identicalな)国内規格JIS X 0221が制定されるなどしています。
  • JIS X 0201 - [[ISO/IEC 2022]]に整合的なコードです。
  • JIS X 0208 - [[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合として設計されています。
  • JIS X 0212 - [[ISO/IEC 2022]]に整合的な2バイト符号化文字集合です。従って、ISO/IEC 2022の枠組みに則って、JIS X 0208と組み合わせあるいは切り替えて用いることができます。例えば、EUC-JPではシングルシフトコードによってGRの文字集合をJIS X 0208と切り替えたり、ISO-2022-JP-2ではエスケープシーケンスによって指示して使うことができます。
  • JIS X 0213 - JIS X 0208に不足していた現代日本の文字を符号化することをねらいとし、JIS X 0208の上位互換として設計されています。[[ISO/IEC 2022]]に整合的な形の、漢字集合1面・漢字集合2面という2つの2バイト符号化文字集合が定義されています。
  • JIS X 0221 - JIS X 0221は、[[ISO/IEC 10646]]と技術的内容が同一である日本の対応規格です。表題を「国際符号化文字集合 (UCS)」としています。
  • JIS2004 - ただし、表外漢字字体表にあわせるとUnicode ([[ISO/IEC 10646]] UCS) との対応に問題を生じるものが10文字あったことから、これらについては独立した符号位置が新たに与えられました。これを表外漢字UCS互換といいます。
  • KS X 1001 - [[ISO/IEC 2022]]に準拠した構造をしています。GL領域にASCIIを、GR領域にこの2バイトコードを呼び出した格好のEUC-KRがよく使われます。
  • MSB - 一方、ASCIIを拡張した形をとる[[ISO/IEC 8859-1]] (Latin-1)では、0xA0-0xFFの領域(GR領域)に文字を割り当てており、ここはMSBが1となります。
  • PocketHpte - WindowsMobile端末用のテキストエディタ[PocketHpte|http://www.hpp.be/Software/PocketHpte/Default.aspx]は、Shift_JIS-2004とEUC-JIS-2004に対応しているとのこと。その他、ISO/IEC 8859のパート1から16まで (12は除く) 対応していることが記されています。
  • UTF-16 - 他方、Unicodeと同等の文字コード規格[[ISO/IEC 10646]]ではUCS-4という4バイトコードが定義されており、これを使うと65,536符号位置からなる面をいくつも扱うことが可能でした。Unicodeの16ビットの符号空間は面00, Basic Multilingual Plane (BMP) という位置付けです。
  • UTF-8 - * [[ISO/IEC 10646]]
  • Unicode - * [[ISO/IEC 10646]] - ISOとIECによる、Unicodeと同等の文字コードの公的標準。
  • Unicode正規化 - 前者は例えば[[ISO/IEC 8859-1]]に見られます。同規格にはa, e, oなどのアルファベットに対して、アキュートアクセントやウムラウト、サーカムフレックス等のダイアクリティカルマークがついた文字が収録されています。Unicodeはこれらをそのまま収録してもいますが、一方で、後者の考え方による合成用のダイアクリティカルマークも用意しており、基底文字(通常のアルファベット)に結合文字を後置することで、記号のついた文字を表現します。
  • エスケープシーケンス - 文字コードにおいてエスケープシーケンスとは、制御文字エスケープ (0x1B) とその後に続く何バイトかの列のことです。文字コードの構造と拡張法を定める国際規格[[ISO/IEC 2022]]において、符号化文字集合の切り替えに用いられます。
  • キリル文字 - * ISO/IEC 8859-5 - [[ISO/IEC 8859]]シリーズの一環。1バイトコード
  • ギリシャ文字 - * ISO/IEC 8859-7 - [[ISO/IEC 8859]]シリーズの一つ。8ビット符号表のGL領域(0x20-0x7F)にASCII, GR領域(0xA0-0xFF)にギリシャ文字集合を置いた形で用いる。
  • ソフトハイフン - !!ISO/IEC 8859-1におけるソフトハイフン
  • ダイアクリティカルマーク - JIS X 0213は、西欧諸言語で用いられるものを中心に、ダイアクリティカルマークつきのアルファベットを収録しています。特に、[[ISO/IEC 8859-1]]と[[ISO/IEC 8859-2]]にある文字は全て入っています。
  • チルダ - !!ASCIIならびにISO/IEC 646におけるチルダ
  • ノーブレークスペース - !!ISO/IEC 8859-1におけるノーブレークスペース
  • ハイフンマイナス - ハイフンマイナスとは、ASCII等にある、ハイフンにもマイナス記号にも使われる、意味合いの曖昧な記号を便宜的にUnicodeないし[[ISO/IEC 10646]]で名付けたものです。
  • ラテン文字 - * ASCII ならびに [[ISO/IEC 646]]国際基準版 - 英語に用いる26文字の大文字小文字。
  • 円記号 - !!ISO/IEC 8859-1における円記号
  • 漢字 - !!ISO/IEC 10646ならびにUnicodeにおける漢字
  • 漢字集合1面 - この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「16区1点」のように表されます。漢字集合2面と区別するために、面番号を先頭につけた面区点番号 (例えば「1面16区1点」)が、符号位置を示すのによく使われます。
  • 漢字集合2面 - この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「1区1点」のように表されます。漢字集合1面と区別するために、面番号を先頭につけた面区点番号が、符号位置を示すのによく使われます。面区点番号は例えば「2面1区1点」のように記します。しばしば「2-1-1」のように略記されます。
  • 国際基準版・漢字用8ビット符号 - 国際基準版・漢字用8ビット符号は、JIS X 0208ならびにJIS X 0213で規定される符号化方式のひとつです。2バイトの漢字コードを[[ISO/IEC 646]]国際基準版 (ASCIIと同じ1バイトコード) と同時に運用するものです。一般的にEUCと呼ばれるコードに対応します。
  • 代替名称 - 例えば、国際基準版・漢字用8ビット符号のように、JIS X 0208と[[ISO/IEC 646]]国際基準版とともに用いる場合、ラテン文字や数字等が両方に存在します。このようなとき、重複符号化を避けるため、どちらか片方 ([[ISO/IEC 2022]]にのっとる場合、指示されるG番号の小さい方) のみを使用することになります。ただし、慣用的に「全角・半角」として異なる文字であるかのように使われてきた経緯があるため、「これまでの慣用的な利用との互換を目的としてだけ,附属書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい」(JIS X 0208:1997 7.2節)とされています。この附属書5「文字の代替名称」には、このような目的に使用できる代替名称が決められています。
  • 波ダッシュ - また、Unicodeと同等の国際規格ISO/IEC 10646の翻訳規格JIS X 0221の1995年版でもJISの1区33点の波ダッシュをU+301Cに対応付けており、各文字に文字名を規定するようになったJIS X 0208:1997はそれを反映して1区33点にWAVE DASHという文字名を与えました(日本語通用名称はそれ以前から「波ダッシュ」)。このように、UnicodeのU+301C WAVE DASHがJISの1区33点の波ダッシュに対応することは一貫しています。
  • 波ダッシュ問題 - 表の中の「文字名」は、JIS X 0208にて規定されている文字名であり、Unicode ([[ISO/IEC 10646]] UCS) の文字名に対応します。
  • 表外漢字UCS互換 - 表外漢字UCS互換とは、JIS X 0213の2004年改正で第3水準漢字に追加された10文字です。ここでいうUCSとは[[ISO/IEC 10646]] UCS (Universal Coded Character Set, 国際符号化文字集合)のことです。JIS X 0213の例示字形を表外漢字字体表に合わせる際にUCSとの互換性の問題から設定されたものです。
  • 符号位置 - [[ISO/IEC 646]]やASCII、JIS X 0201のような1バイトコードでは、符号位置はx/yのような形で示されます。xとyはそれぞれ0以上の整数で、符号表の列と行を表します。x/yの形で示された符号位置はビット組み合わせに一意に対応します (参照: ISO/IEC 646:1991の5.2節)。
  • 符号化文字集合 - これは[[ISO/IEC 646]]や[[ISO/IEC 8859]]といった国際規格における定義と同等の内容です。例えば[[ISO/IEC 646]]:1991では下記のように定義されています。ASCIIを定めるANSI X3.4でも同じです。
  • 文字コード - ひとつめの意味は、例えば「ASCII」や「[[ISO/IEC 8859-1]]」、「Shift_JIS-2004」などが該当します(IETFの語法で「文字符号化方式」に当たるものも含みます)。ISOやJISの定義で「符号 (code)」という語は「符号化文字集合」と同義なので、「文字コード」という広く知られている言葉を「符号化文字集合」と対応させて用いることができます。
  • 文字名 - 文字名とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて各文字(符号位置)に与えられた名前です。ラテン大文字で付けられています。
  • 包摂 - !!ISO/IEC 10646の包摂規準