トップ一覧検索ヘルプ RSS ログイン

検索

BMP - 当初のUnicodeは、このうち群00の面00の65,536符号位置のみを用いる16ビットの文字コードとして設計されました。この面00がBMPです。
CJK互換漢字 - CJK互換漢字とは、Unicodeならびに[[ISO/IEC 10646]]において、CJK統合漢字とは別に、他の文字コードとの互換性のために用意されている漢字の符号位置です。
CJK統合漢字 - その後、CJK統合漢字拡張AがBMP内に追加され、ついで、面02にCJK統合漢字拡張Bが追加されました。現在、拡張Hまであります。拡張Bから拡張Fまでは面02にあり(つまり符号位置U+2xxxx)、拡張G, Hは面03 (U+3xxxx)に配置されています。
CP932 - * JIS X 0208との不整合 (既存の符号位置に包摂されるべき字体にも無秩序に符号位置を割り当てている)
ISO/IEC 10646 - ISO/IEC 10646はUnicodeと同等の文字コードを定義しており、互いに同期するよう更新されています。つまり、Unicodeの新しい版で追加された文字はISO/IEC 10646にも同じ符号位置に追加される、その反対も同じ、ということです。
ISO/IEC 646 - この規格はASCIIと同等の符号表のうちの12の符号位置について、
ISO/IEC 8859-1 - ただし、符号位置11/05のマイクロ記号は、既に存在するギリシャ文字ミュー(μ)との重複符号化になるため別区点を与えてはいません。
ISO/IEC 8859-2 - [[ISO/IEC 8859-1]]といくつかの文字が共通しています。それらの文字は、8859-1と同じ符号位置に割り当てられています。
JIS X 0201 - 2文字のみ異なります。符号位置5/12 (0x5C)がバックスラッシュでなく円記号、
JIS X 0208 - *1983年: 改正。記号類の追加のほか、一部の漢字の符号位置の入れ替え、字体の簡略化。
JIS X 0213 - JIS X 0213はその各文字について、Unicode ([[ISO/IEC 10646]] UCS) の対応する文字名・符号位置を定めています。これに基づいて、Unicodeとの間でコード変換ができます。
JIS2004 - ただし、表外漢字字体表にあわせるとUnicode ([[ISO/IEC 10646]] UCS) との対応に問題を生じるものが10文字あったことから、これらについては独立した符号位置が新たに与えられました。これを表外漢字UCS互換といいます。
Shift_JIS-2004 - Windowsのベンダ定義外字の丸付き数字やローマ数字も救済でき、かつ、波ダッシュを正しい符号位置(U+301C)に変換します。波ダッシュだけでなく、双柱や負符号なども文字化けせず正しく変換します。
UTF-16 - UTF-16は、Unicodeの符号化方式のひとつです。16ビットを1単位として、ひとつのUnicode符号位置を16ビットまたは32ビットで表します。16ビット固定長のUnicodeの元々の形式に基づいて拡張を施したものです。
UTF-8 - Unicodeの符号位置 (大まかに言うと文字に対応) ひとつにつき、1バイトから4バイトまでの長さを取る可変長のコードです。
Unicode - Unicodeでは、JIS X 0213の全ての文字に対し単一の符号位置が割り当てられているわけではありません。
Unicode正規化 - 日本語の平仮名・片仮名の濁点についても同様で、「が」という字を表すのに、単一の(合成済みの)符号位置で表すのと、「か」に合成用濁点を後置するのと、ふたとおりの符号化表現が可能です。
mlterm - 上はmltermとw3mによる表示例です。JIS X 0213で符号位置の割り当てられた
アイヌ語 - 符号位置としては、漢字集合1面の、5区92点から94点、および、6区78点から94点に、上記の文字が入っています。
ウムラウト - JIS X 0208は単独のウムラウト記号「¨」に符号位置を与えています(1区15点)。Unicodeに対応する文字名はDIAERESISとされています。
ギリシャ文字 - ラテン文字の元になっており、両者には形の共通する文字もあります。例えば、ギリシャ文字のアルファの大文字(Α)は、ラテン文字の対応する「A」(エー)と同じ形です。ただし文字コードでは、形の区別が困難であっても、ラテン文字とギリシャ文字という異なる文字体系(用字系, script)ではそれぞれに独立した符号位置を与えるのが普通です。
ソフトハイフン - 符号位置10/13 (16進表記で0xAD) にソフトハイフンがあります。文字名はSOFT HYPHEN です。([[ISO/IEC 8859-1]]のTable 1を参照)
チルダ - ASCIIと[[ISO/IEC 646]]国際基準版においては、符号位置7/14 (0x7E)にチルダがあります。Unicodeならびに[[ISO/IEC 10646]]における文字名はTILDEです。
ノーブレークスペース - 符号位置10/0 (16進で0xA0) にノーブレークスペースがあります。
ハイフンマイナス - ASCIIの記号「-」は、符号位置2/13にあります。16進では0x2Dとなります。これはハイフンにもマイナスにもどちらにも使われてきました。
ラテン文字 - Unicodeに単一の符号位置がないラテン文字もいくつかあります。
ローマ数字 - ただし、Unicode正規化処理のNFKC, NFKDによって、例えば「III」(を1文字にした符号位置)が「ラテン大文字のIの三つの並び」になるなどします。
円記号 - JIS X 0201のラテン文字集合の符号位置5/12 (16進で0x5C)に円記号があります。
漢字集合1面 - この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「16区1点」のように表されます。漢字集合2面と区別するために、面番号を先頭につけた面区点番号 (例えば「1面16区1点」)が、符号位置を示すのによく使われます。
漢字集合2面 - この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「1区1点」のように表されます。漢字集合1面と区別するために、面番号を先頭につけた面区点番号が、符号位置を示すのによく使われます。面区点番号は例えば「2面1区1点」のように記します。しばしば「2-1-1」のように略記されます。
丸付き数字 - 上記の丸付き数字それぞれに対応するUnicode符号位置は、当サイトの「[JIS X 0213とUnicodeの対応表|http://x0213.org/codetable/]」から得られます。
規格票・関連文献等 - *日本規格協会から『増補改訂 JIS漢字字典』(ISBN:4-542-20129-5) が発売されました。 JIS第1～第4水準までの全漢字・非漢字を収録しています。 JISの符号位置だけでなく、UCS (Unicode)との対応や、字形例、それに大量の人名・地名用例などの情報が得られます。旧版と比較すると、非漢字が本格的に取り込まれたのが大きな特徴といえます。非漢字に対しても、形の似た文字への参照や用法の説明など、実装に役立つ情報が盛り込まれています。また、JIS X 0208:1997、JIS X 0213:2000の縮刷版を一部収録しています。ただし2004年版の情報は未収録であり、UCSとの対応ではいわゆる「カッコつきUCS」が一部そのまま載っている点など注意が必要です。→「JIS漢字字典補足」も参照のこと
国内実装互換 - 国内実装互換とは、ベンダ定義外字との互換性を考慮してJIS X 0213に設定された符号位置です。
人名用漢字 - JIS X 0213のサブセットであるJIS X 0208は、人名用漢字で区別されている字体のいくつかを区別せず包摂して同じ符号位置で表します。例えば、「渚」という漢字のつくりの「者」に点がつくかどうかは、人名用漢字の表には両方の字体が載っていますが、JIS X 0208は両者を区別せず単一の符号位置(29-77)で表します。一方、X0208の拡張規格であるJIS X 0213はこれを分離して、1-29-77は点のない「渚」専用となり、これとは別の符号位置1-86-87 (第3水準)に、「点のある『渚』」を追加しています。
双柱 - 双柱とは、垂直線を2本並べた記号です。印刷物において区切りの記号として用いられます。JIS X 0208 (したがってJIS X 0213も) やUnicodeで符号位置が与えられています。
濁点 - JIS X 0201片仮名集合には、独立した濁点に符号位置が与えられています(符号位置5/14。GLに呼び出したときは16進表記で0x5E, GRでは0xDE)。一方、「ガ」「ザ」のように片仮名に濁点をつけた文字には符号位置が与えられていません。したがって、濁音を表すには「カ」の直後に独立した「゛」を置くという方式が取られます。
波ダッシュ - 波ダッシュはJIS X 0208の1区33点にあります。したがって、JIS X 0213では1面1区33点です。この符号位置はShift_JISの符号化表現では0x8160にあたります。文字名はWAVE DASHと規定されています。日本語通用名称は「波ダッシュ」です。
波ダッシュ問題 - 波ダッシュ問題とは、Shift_JISやEUC-JPのようなJIS X 0208ベースのコードからUnicodeに変換する際に、一部の記号の対応するUnicode符号位置がおかしいコード変換の実装がある問題を指します。記号の文字化けの原因となっています。この問題に現れる代表的な記号が波ダッシュであることから、波ダッシュ問題といいます。
半濁点 - JIS X 0201片仮名集合には、独立した半濁点に符号位置が与えられています(符号位置5/15。GLに呼び出したときは16進表記で0x5F, GRでは0xDF)。一方、「パ」のように片仮名に半濁点をつけた文字には符号位置が与えられていません。したがって、半濁音を表すには「ハ」の直後に独立した「゛」を置くという方式が取られます。
鼻濁音 - JIS X 0213が制定されたあと、Unicodeに無かった文字はUnicodeへの収録作業が行われましたが、これら鼻濁音表記用の平仮名・片仮名は、既にある通常の文字に合成用半濁点(U+309A)を続けることで表現可能であるとして、独立した符号位置を与えられませんでした。例えば、「か」に続けてU+309Aを置くことで「半濁点つきの『か』」を表します。
表外漢字UCS互換 - それは、既存のJISに例示されている字体と表外漢字字体表の字体とが異なり、その両方がUnicodeでは別々の符号位置を与えられている場合です。例えば、「剥」(1-39-77)のJIS X 0213:2000の規格票に印刷された字体と表外漢字字体表の「印刷標準字体」はどちらもUnicodeにあります (U+5265, U+525D)。
表外漢字字体表 - JIS X 0213の2004年改正は、例示字形を表外漢字字体表に合わせることを目的として行われました。この結果、例示字形を変更すると不都合の生じるもの10文字の印刷標準字体については「表外漢字UCS互換」という形で新たに符号位置を与えられました。
符号位置 - 符号位置
文字名 - 文字名とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて各文字(符号位置)に与えられた名前です。ラテン大文字で付けられています。
片仮名 - JIS X 0201片仮名集合には通常の現代日本語表記に用いる片仮名が収められていますが、濁点・半濁点つきの文字には独立した符号位置が与えられていません。濁点や半濁点も1文字として扱われます。
包摂 - 文字コードにおいて包摂(ほうせつ)とは、ひとつの符号位置に複数の字体が対応することです。英語ではunificationといいます。
面区点番号 - 面区点番号とは、JIS X 0213の符号位置(文字コード表の中の位置)を表すための番号です。3つの整数、すなわち面番号、区番号、点番号の組として表されます。例えば、「1面16区11点」のように表します。しばしば「1-16-11」のように略記されます。1-16-11は「茜」という漢字が割り当てられている符号位置です。

検索

メニュー

文字コード参考文献

重要な項目

更新履歴