トップ一覧検索ヘルプ RSS ログイン

検索

ACMS B2B - V.2.9.0から、ISO-2022-JP-2004/Shift_JIS-2004/EUC-JIS-2004及び Unicode 間で、相互に文字コードを変換することが可能になりました。
ACMS EAIpro - JIS X 0213:2004の符号化方式 ISO-2022-JP-2004/Shift_JIS-2004/EUC-JIS-2004及び Unicode 間で、相互に文字コードを変換することが可能になりました。
ASCII - 国際規格である[[ISO/IEC 646]]の国際基準版は、ASCIIと同等の文字コードです。
Alpha - EUC-JIS-2004、ISO-2022-JP-2004、Shift_JIS-2004に対応しています。
AnyTran - V.5.5.0から、JIS X 0213:2004の符号化方式 ISO-2022-JP-2004/Shift_JIS-2004/EUC-JIS-2004及び Unicode 間で、相互に文字コードを変換することが可能になりました。
Apsaly - Windows用のフリーのテキストエディタApsalyはShift_JISX0213, EUC-JISX0213, ISO-2022-JP-3 に対応しているとのこと。
BBS-相談所/3 - !![[Re: ISO-2022-JP-2004 vs Unicode mapping table|BBS-相談所/3]] - えむけい (2006年06月06日 06時01分35秒)
BMP - BMP (Basic Multilingual Plane, 基本多言語面)は、Unicode並びに[[ISO/IEC 10646]]の面00に付けられた呼び名です。
CJK互換漢字 - CJK互換漢字とは、Unicodeならびに[[ISO/IEC 10646]]において、CJK統合漢字とは別に、他の文字コードとの互換性のために用意されている漢字の符号位置です。
CJK統合漢字 - CJK統合漢字とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて、東アジアの漢字文化圏各国の漢字コード規格にある漢字を統合して作成された漢字集合です。CJKという呼び方はChina, Japan, Koreaの頭文字から来ています。
EUC - [[ISO/IEC 2022]]に則った形式ですが、エスケープシーケンスは用いません。GR領域に複数の符号化文字集合を切り替えて使うのには、シングルシフトコードを用います。コード値0x8E (シングルシフト2、SS2)または0x8F (シングルシフト3、SS3)です。シングルシフトは1文字分だけ有効な切り替えなので、ISO-2022-JPのようなエスケープシーケンスによる切り替えと違って状態を持つ必要がありません。つまりステートレスなコードです。
EUC-JIS-2004 - *[[ISO-2022-JP-2004]] - 本符号化方式と同様のJIS X 0213の符号化方式の一種
EUC-JP - 0x8F, 0x8Eは[[ISO/IEC 2022]]で取り決められているシングルシフトの制御コードです。
Emacs - 対応しています。JIS2004の符号化方式であるEUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004を
GB 2312 - [[ISO/IEC 2022]]に準拠した構造をしています。GL領域にASCIIを、GR領域にこの2バイトコードを呼び出した格好のEUC-CNがよく使われます。
GNU C Library - バージョン2.3以降で、文字コード変換の関数・コマンドのiconvでJIS X 0213の符号化方式(EUC-JISX0213, ISO-2022-JP-3, Shift_JISX0213)をサポートしています。
Gauche - EUC-JISX0213, Shift_JISX0213, ISO-2022-JP-3を扱うことができ、相互に
IEC - 文字コードを含む情報工学分野では、ISOと共同して標準化を行っています。
ISO - ISO
ISO-2022-JP - ISO-2022-JP
ISO-2022-JP-2004 - ISO-2022-JP-2004
ISO-2022-JP-3 - ISO-2022-JP-3
ISO/IEC 10646 - ISO/IEC 10646
ISO/IEC 2022 - ISO/IEC 2022
ISO/IEC 646 - ISO/IEC 646
ISO/IEC 8859 - ISO/IEC 8859
ISO/IEC 8859-1 - ISO/IEC 8859-1
ISO/IEC 8859-2 - ISO/IEC 8859-2
JIS - 1995年以降、WTO/TBT協定によって、国内規格はISOやIECのような国際規格と整合性が取られるよう改訂されています。日本の文字コード規格はもともと国際規格 [[ISO/IEC 2022]] と整合するよう規定されてきましたが、1995年以降の改訂では、規格の標題や構成のような形式的な面からも整合が図られています。また、[[ISO/IEC 10646]]と技術的に一致する(identicalな)国内規格JIS X 0221が制定されるなどしています。
JIS X 0201 - [[ISO/IEC 2022]]に整合的なコードです。
JIS X 0208 - [[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合として設計されています。
JIS X 0212 - [[ISO/IEC 2022]]に整合的な2バイト符号化文字集合です。従って、ISO/IEC 2022の枠組みに則って、JIS X 0208と組み合わせあるいは切り替えて用いることができます。例えば、EUC-JPではシングルシフトコードによってGRの文字集合をJIS X 0208と切り替えたり、ISO-2022-JP-2ではエスケープシーケンスによって指示して使うことができます。
JIS X 0213 - JIS X 0208に不足していた現代日本の文字を符号化することをねらいとし、JIS X 0208の上位互換として設計されています。[[ISO/IEC 2022]]に整合的な形の、漢字集合1面・漢字集合2面という2つの2バイト符号化文字集合が定義されています。
JIS X 0221 - JIS X 0221は、[[ISO/IEC 10646]]と技術的内容が同一である日本の対応規格です。表題を「国際符号化文字集合 (UCS)」としています。
JIS2004 - ただし、表外漢字字体表にあわせるとUnicode ([[ISO/IEC 10646]] UCS) との対応に問題を生じるものが10文字あったことから、これらについては独立した符号位置が新たに与えられました。これを表外漢字UCS互換といいます。
JISコード - * 上の意味のJISコードを1バイトコードと併用する符号化方式、例えばISO-2022-JP
KS X 1001 - [[ISO/IEC 2022]]に準拠した構造をしています。GL領域にASCIIを、GR領域にこの2バイトコードを呼び出した格好のEUC-KRがよく使われます。
MSB - 一方、ASCIIを拡張した形をとる[[ISO/IEC 8859-1]] (Latin-1)では、0xA0-0xFFの領域(GR領域)に文字を割り当てており、ここはMSBが1となります。
Menu - *ISO-2022-JP-2004
Mew - ISO-2022-JP-3に対応しています。
Mule-UCS - shift_jisx0213、iso-2022-jp-3 が使用可能になります。
PHP - Webサイトによく使われるプログラミング言語の[PHP|http://php.net/]では、バージョン5.4からJIS X 0213の3つの符号化方式、Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004が使えるようになったそうです。mbstring拡張モジュールで対応しているとのことです。
Perl - ISO-2022-JP-3を扱えるようです。
PocketHpte - WindowsMobile端末用のテキストエディタ[PocketHpte|http://www.hpp.be/Software/PocketHpte/Default.aspx]は、Shift_JIS-2004とEUC-JIS-2004に対応しているとのこと。その他、ISO/IEC 8859のパート1から16まで (12は除く) 対応していることが記されています。
Python - しています。codecで、EUC-JIS-2004, ISO-2022-JP-2004, Shift_JIS-2004が
RACCOON - データ・アプリケーション(DAL)のシステム連携のためのソフトウェア製品「RACCOON(ラクーン)」は、JIS X 0213の符号化方式、Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004に対応しています。
Ruby - ISO-2022-JP-3 が扱えます (呼び出すiconvの実装、バージョンに依存します)。
Shift_JIS - *ISO-2022-JP - JIS X 0208の符号化方式の一種
Shift_JIS-2004 - *ISO-2022-JP-2004 - 本符号化方式と同様のJIS X 0213の符号化方式の一種
TeX - ttkさんの「[pTeXでEUC-JISX0213, ISO-2022-JP-3, ISO-2022-JP-2004を使うための拡張|http://homepage3.nifty.com/ttk/comp/tex/jisx0213.html]」を使うと、
UTF-16 - 他方、Unicodeと同等の文字コード規格[[ISO/IEC 10646]]ではUCS-4という4バイトコードが定義されており、これを使うと65,536符号位置からなる面をいくつも扱うことが可能でした。Unicodeの16ビットの符号空間は面00, Basic Multilingual Plane (BMP) という位置付けです。
UTF-8 - * [[ISO/IEC 10646]]
Unicode - * [[ISO/IEC 10646]] - ISOとIECによる、Unicodeと同等の文字コードの公的標準。
Unicode正規化 - 前者は例えば[[ISO/IEC 8859-1]]に見られます。同規格にはa, e, oなどのアルファベットに対して、アキュートアクセントやウムラウト、サーカムフレックス等のダイアクリティカルマークがついた文字が収録されています。Unicodeはこれらをそのまま収録してもいますが、一方で、後者の考え方による合成用のダイアクリティカルマークも用意しており、基底文字(通常のアルファベット)に結合文字を後置することで、記号のついた文字を表現します。
Yudit - ファイルの入出力で、Shift_JISX0213、EUC-JISX0213、ISO-2022-JP-3が指定
gTef - EUC-JIS-2004、ISO-2022-JP-2004、Shift_JIS-2004のそれぞれに対応しているという
jless - EUC-JISX0213、ISO-2022-JP-3、Shift_JISX0213、
kf - これによって、JIS X 0208との互換性を保ったまま、Shift_JISX0213、EUC-JISX0213、ISO-2022-JP-3に対応します。
libiconv - libiconvはJIS X 0213の符号化方式である Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004 に対応しています。
mlterm - エンコーディングとして、EUC-JISX0213、Shift_JISX0213、ISO-2022-JP-3
nkf - ものすごく古い漢字コード変換プログラムである[nkf|http://sourceforge.jp/projects/nkf/]は、2006年7月リリースのVer.2.0.7で、Shift_JISX0213, EUC-JISX0213, ISO-2022-JP-3, Shift_JIS-2004, EUC-JIS-2004に対応しているとのこと。
nvi-m17n - nviの多言語化(m17n)パッチの最新のものは、iso-2022-jp-3, euc-jisx0213に対応している模様。
エスケープシーケンス - 文字コードにおいてエスケープシーケンスとは、制御文字エスケープ (0x1B) とその後に続く何バイトかの列のことです。文字コードの構造と拡張法を定める国際規格[[ISO/IEC 2022]]において、符号化文字集合の切り替えに用いられます。
キリル文字 - * ISO/IEC 8859-5 - [[ISO/IEC 8859]]シリーズの一環。1バイトコード
ギリシャ文字 - * ISO/IEC 8859-7 - [[ISO/IEC 8859]]シリーズの一つ。8ビット符号表のGL領域(0x20-0x7F)にASCII, GR領域(0xA0-0xFF)にギリシャ文字集合を置いた形で用いる。
ソフトハイフン - !!ISO/IEC 8859-1におけるソフトハイフン
ダイアクリティカルマーク - JIS X 0213は、西欧諸言語で用いられるものを中心に、ダイアクリティカルマークつきのアルファベットを収録しています。特に、[[ISO/IEC 8859-1]]と[[ISO/IEC 8859-2]]にある文字は全て入っています。
チルダ - !!ASCIIならびにISO/IEC 646におけるチルダ
ノーブレークスペース - !!ISO/IEC 8859-1におけるノーブレークスペース
ハイフンマイナス - ハイフンマイナスとは、ASCII等にある、ハイフンにもマイナス記号にも使われる、意味合いの曖昧な記号を便宜的にUnicodeないし[[ISO/IEC 10646]]で名付けたものです。
ラテン文字 - * ASCII ならびに [[ISO/IEC 646]]国際基準版 - 英語に用いる26文字の大文字小文字。
ローマ字 - 日本語をローマ字で綴る方式には主に訓令式とヘボン式のふたとおりがあります。訓令式は昭和29年に内閣告示されている方式で、国際標準ISO 3602 (Romanization of Japanese)にも採用されています。ヘボン式は、19世紀に日本に来たアメリカ人医師のJames Curtis Hepburnが和英辞典「和英語林集成」で用いたものが由来で、いくつか細かなバリエーションがあります。
円記号 - !!ISO/IEC 8859-1における円記号
改定された常用漢字とJIS漢字コード規格 - こうした文字は、JIS X 0213の符号化方式のEUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004、あるいはUnicodeの符号化方式のUTF-8, UTF-16, UTF-32を使うと符号化できます。
漢字 - !!ISO/IEC 10646ならびにUnicodeにおける漢字
漢字コード - ** あるいはその符号化方式のISO-2022-JP, EUC-JP, Shift_JIS等
漢字集合1面 - この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「16区1点」のように表されます。漢字集合2面と区別するために、面番号を先頭につけた面区点番号 (例えば「1面16区1点」)が、符号位置を示すのによく使われます。
漢字集合2面 - この符号化文字集合は、[[ISO/IEC 2022]]に整合的な94×94文字の2バイト符号化文字集合です。各符号位置には7ビットの2バイトコードが対応します。符号位置は区点番号で例えば「1区1点」のように表されます。漢字集合1面と区別するために、面番号を先頭につけた面区点番号が、符号位置を示すのによく使われます。面区点番号は例えば「2面1区1点」のように記します。しばしば「2-1-1」のように略記されます。
関連データ - *「[JIS X 0213のコード対応表|http://x0213.org/codetable/]」。今のところ、Shift_JIS-2004、EUC-JIS-2004、ISO-2022-JP-2004、漢字7ビット符号のそれぞれとUnicodeとの対応表があります。
国際基準版・漢字用8ビット符号 - 国際基準版・漢字用8ビット符号は、JIS X 0208ならびにJIS X 0213で規定される符号化方式のひとつです。2バイトの漢字コードを[[ISO/IEC 646]]国際基準版 (ASCIIと同じ1バイトコード) と同時に運用するものです。一般的にEUCと呼ばれるコードに対応します。
代替名称 - 例えば、国際基準版・漢字用8ビット符号のように、JIS X 0208と[[ISO/IEC 646]]国際基準版とともに用いる場合、ラテン文字や数字等が両方に存在します。このようなとき、重複符号化を避けるため、どちらか片方 ([[ISO/IEC 2022]]にのっとる場合、指示されるG番号の小さい方) のみを使用することになります。ただし、慣用的に「全角・半角」として異なる文字であるかのように使われてきた経緯があるため、「これまでの慣用的な利用との互換を目的としてだけ，附属書5表2に規定する文字をISO/IEC 646で規定される文字とは異なった図形文字として用いてもよい」(JIS X 0208:1997 7.2節)とされています。この附属書5「文字の代替名称」には、このような目的に使用できる代替名称が決められています。
超漢字メール - よると、「超漢字メール」はISO-2022-JP-3やEUC-JISX0213、Shift_JISX0213に
波ダッシュ - また、Unicodeと同等の国際規格ISO/IEC 10646の翻訳規格JIS X 0221の1995年版でもJISの1区33点の波ダッシュをU+301Cに対応付けており、各文字に文字名を規定するようになったJIS X 0208:1997はそれを反映して1区33点にWAVE DASHという文字名を与えました(日本語通用名称はそれ以前から「波ダッシュ」)。このように、UnicodeのU+301C WAVE DASHがJISの1区33点の波ダッシュに対応することは一貫しています。
波ダッシュ問題 - 表の中の「文字名」は、JIS X 0208にて規定されている文字名であり、Unicode ([[ISO/IEC 10646]] UCS) の文字名に対応します。
表外漢字UCS互換 - 表外漢字UCS互換とは、JIS X 0213の2004年改正で第3水準漢字に追加された10文字です。ここでいうUCSとは[[ISO/IEC 10646]] UCS (Universal Coded Character Set, 国際符号化文字集合)のことです。JIS X 0213の例示字形を表外漢字字体表に合わせる際にUCSとの互換性の問題から設定されたものです。
符号位置 - [[ISO/IEC 646]]やASCII、JIS X 0201のような1バイトコードでは、符号位置はx/yのような形で示されます。xとyはそれぞれ0以上の整数で、符号表の列と行を表します。x/yの形で示された符号位置はビット組み合わせに一意に対応します (参照: ISO/IEC 646:1991の5.2節)。
符号化文字集合 - これは[[ISO/IEC 646]]や[[ISO/IEC 8859]]といった国際規格における定義と同等の内容です。例えば[[ISO/IEC 646]]:1991では下記のように定義されています。ASCIIを定めるANSI X3.4でも同じです。
文字コード - * 文字の集合を定めて、その集合内の各文字に符号化表現を与えたもの。ISOやJISの標準で定義される「符号化文字集合(coded character set)」に同じ
文字名 - 文字名とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて各文字(符号位置)に与えられた名前です。ラテン大文字で付けられています。
包摂 - !!ISO/IEC 10646の包摂規準
面区点番号 - 例えば、16区11点は、コード表の16行目の11列目の位置を表し、コード値(ビット組合せ) 0110000 0101011 (16進表記302B)が対応します。その位置に割り当てられている文字は「茜」です。実際のコード表([JIS X 0208|https://www.itscj.ipsj.or.jp/iso-ir/168.pdf]または[JIS X 0213漢字集合1面|https://www.itscj.ipsj.or.jp/iso-ir/233.pdf])を見ると、ここで述べた内容が理解しやすいでしょう。

検索

メニュー

文字コード参考文献

重要な項目

更新履歴