検索
- ACMS B2B -
V.2.9.0から、ISO-2022-JP-2004/Shift_JIS-2004/EUC-JIS-2004及び Unicode 間で、相互に文字コードを変換することが可能になりました。
- ACMS EAIpro -
JIS X 0213:2004の符号化方式 ISO-2022-JP-2004/Shift_JIS-2004/EUC-JIS-2004及び Unicode 間で、相互に文字コードを変換することが可能になりました。
- AnyTran -
V.5.5.0から、JIS X 0213:2004の符号化方式 ISO-2022-JP-2004/Shift_JIS-2004/EUC-JIS-2004及び Unicode 間で、相互に文字コードを変換することが可能になりました。
- BBS-相談所/3 -
!![[Re: ISO-2022-JP-2004 vs Unicode mapping table|BBS-相談所/3]] - えむけい (2006年06月06日 06時01分35秒)
- BMP -
BMP (Basic Multilingual Plane, 基本多言語面)は、Unicode並びに[[ISO/IEC 10646]]の面00に付けられた呼び名です。
- CJK互換漢字 -
CJK互換漢字とは、Unicodeならびに[[ISO/IEC 10646]]において、CJK統合漢字とは別に、他の文字コードとの互換性のために用意されている漢字の符号位置です。
- CJK統合漢字 -
CJK統合漢字とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて、東アジアの漢字文化圏各国の漢字コード規格にある漢字を統合して作成された漢字集合です。CJKという呼び方はChina, Japan, Koreaの頭文字から来ています。
- CP932 -
* Unicodeとの変換が間違っている波ダッシュ問題
- EUC-JIS-2004 -
*[JIS X 0213のコード対応表|http://x0213.org/codetable/] - Unicodeとの機械可読形式の変換表があります
- GB 2312 -
GB 2312は、[[ISO/IEC 10646]] (Unicode)のCJK統合漢字が最初に作られた際に元になった漢字集合のひとつです。
- GNU C Library -
もちろん、UTF-8やUTF-16といったUnicodeの符号化方式との間で変換することもできます。
- HP-UX -
JIS X 0213の符号化方式であるShift_JIS-2004, EUC-JIS-2004とUnicodeとの間の変換をiconvコマンド/ライブラリで行うことができます。
- ISO/IEC 10646 -
ISO/IEC 10646は、世界中の文字を対象とした文字コードの国際標準です。ISOとIECによって策定された公的標準です。Unicodeと同等の文字コードを定めています。
- ISO/IEC 646 -
* ISO/IEC 646の現在の版では各文字についてISO/IEC 10646 (あるいはUnicode)の文字に対応する文字名が記されています。
- ISO/IEC 8859-1 -
!!Unicodeならびに[[ISO/IEC 10646]]との関係
- JIS X 0201 -
JIS X 0201片仮名集合においては、濁点・半濁点の付いた片仮名には独立した符号位置が与えられていません。濁点と半濁点それ自体に対応する符号位置があるので、例えば「ガ」を表すには「カ」「゛」という2文字の列として表す必要があります。なおこの濁点・半濁点はUnicodeにあるような合成用の文字ではなく、前進を伴う文字とされています。
- JIS X 0208 -
*1997年: 改正。コード表には変更を加えず、符号位置に対応する文字の明確化や漢字の典拠調査を行う大規模な改正。包摂規準の明確化、[シフトJIS|http://x0213.org/wiki/wiki.cgi?page=Shift%5FJIS]の規定、文字名の規定(Unicodeとの変換表に相当)等。
- JIS X 0212 -
なお、UnicodeでJIS X 0212に対応したと主張する製品もありますが、それはUnicodeにJIS X 0212の文字が全て含まれているというだけのことで、JIS X 0212という文字コード規格に対応しているわけではありません。
- JIS X 0213 -
!!UnicodeないしISO/IEC 10646との関係
- JIS2004 -
ただし、表外漢字字体表にあわせるとUnicode ([[ISO/IEC 10646]] UCS) との対応に問題を生じるものが10文字あったことから、これらについては独立した符号位置が新たに与えられました。これを表外漢字UCS互換といいます。
- Java -
Javaの内部コードはUnicode (UTF-16)なので、UnicodeとShift_JIS-2004とのコード変換が
- KS X 1001 -
KS X 1001は、[[ISO/IEC 10646]] (Unicode)のCJK統合漢字が最初に作られた際に元になった漢字集合のひとつです。
- Macintosh OS X -
*メーリングリストにも書きましたが、テストページを作ってくだされば、テストすることは可能です。MacOS X ver10.4.11でダウンロードされるSafari ver.3.0.4 を用いると、表示→テキストエンコーディング→日本語(ShiftJIS X0213)というエンコーディングが機能するようになりました。Unicode3.2 に対応しているフォントで表示されます。MacOS X ver10.3 以前でダウンロードできるSafari ver.1.1では、Safari→環境設定→テキストエンコーディング→日本語(Shift JIS X0213)というエンコーディングが選択できましたが、機能してませんでした。 OS X Leopardになっても状況は同じで、日本語(Shift JISX0213)というエンコーディングが機能するようになっています。 - kumanesir (2008年02月10日 00時50分02秒)
- Mule-UCS -
Emacs用のパッケージMule-UCSは、EmacsでJIS X 0213やUnicodeを扱う
- Python -
unicode_obj = dec(s)[0]
- Ruby -
JavaやPython等と異なり、内部処理用にUnicodeに変換するのでなく、
- Shift_JIS -
!Unicode
- UNICODE2SJIS2004 - UNICODE2SJIS2004
- UTF-16 -
UTF-16は、Unicodeの符号化方式のひとつです。16ビットを1単位として、ひとつのUnicode符号位置を16ビットまたは32ビットで表します。16ビット固定長のUnicodeの元々の形式に基づいて拡張を施したものです。
- UTF-8 -
UTF-8は、Unicodeの符号化方式のひとつです。
- Unicode - Unicode
- Unicode正規化 - Unicode正規化
- Wnn8 for Linux/BSD -
Linux/BSD用の文字入力ソフトウェア[Wnn8 for Linux/BSD|http://www.omronsoft.co.jp/SP/pcunix/wnn8/index.html]はJIS X 0213の文字の入力に対応しています。EUCロケール、Unicodeロケールの両方でJIS X 0213に対応しているとのことです。
- XANO明朝 -
内部エンコードがシフトJIS版とUnicode版とがあります。Windows 95/98/MeではシフトJIS版、Windows NT/2000/XPではUnicode版を使うと良いでしょう。
- Y.OzFont -
Y.OzFontは、Y.Ozさんが製作したJIS X 0213:2004実装水準4に対応したUnicode配列の手書き風フォントです。フリーソフトで権利の放棄はしていません。
- nkf -
* [nkfとiconvの差異|https://nathancorvussolis.blogspot.jp/2015/05/difference-between-nkf-and-iconv.html] (kin'u) - EUC-JIS-2004とShift_JIS-2004のそれぞれからUnicodeに変換する場合のnkfとlibiconvの変換結果の差異を調査した報告。
- skf - simple kanji filter -
JIS X 0213:2000, JIS X 0213:2004の各エンコーディングの他にもUnicodeや補助漢字を含む多数のコードに対応しています。
- アイヌ語 -
!!Unicodeへの取り入れ
- アイヌ語用カタカナ文字入力支援マクロ -
派生してUnicode用の同様のマクロも作られたようです。
- ウムラウト -
JIS X 0208は単独のウムラウト記号「¨」に符号位置を与えています(1区15点)。Unicodeに対応する文字名はDIAERESISとされています。
- キリル文字 -
* Unicode / [[ISO/IEC 10646]]
- ギリシャ文字 -
* Unicode ならびに [[ISO/IEC 10646]]
- サクラエディタ -
!!![サクラエディタ|http://www.geocities.jp/moca_skr/unicode/wchar007.html]
- ソフトハイフン -
!!UnicodeならびにISO/IEC 10646におけるソフトハイフン
- チルダ -
ASCIIと[[ISO/IEC 646]]国際基準版においては、符号位置7/14 (0x7E)にチルダがあります。Unicodeならびに[[ISO/IEC 10646]]における文字名はTILDEです。
- ノーブレークスペース -
!!UnicodeならびにISO/IEC 10646におけるノーブレークスペース
- ハイフンマイナス -
ハイフンマイナスとは、ASCII等にある、ハイフンにもマイナス記号にも使われる、意味合いの曖昧な記号を便宜的にUnicodeないし[[ISO/IEC 10646]]で名付けたものです。
- ラテン文字 -
* Unicode ならびに [[ISO/IEC 10646]] - ASCIIとISO/IEC 8859-1を並び順を保ったままコピーしています。また、英語以外に用いられるラテン文字も多数含んでいます。
- ローマ数字 -
!!Unicodeにおけるローマ数字
- 円記号 -
!!Unicodeならびに[[ISO/IEC 10646]]における円記号
- 改定された常用漢字とJIS漢字コード規格 -
こうした文字は、JIS X 0213の符号化方式のEUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004、あるいはUnicodeの符号化方式のUTF-8, UTF-16, UTF-32を使うと符号化できます。
- 外字 -
例えば、丸付き数字はJIS X 0208にないので、この文字コードにとっては、符号化できない外字となります。これが上記1番目の意味です。(JIS X 0213やUnicodeには丸付き数字はあるので、これらの文字コードにとっては外字ではありません)
- 漢字 -
!!ISO/IEC 10646ならびにUnicodeにおける漢字
- 関連データ -
*「[JIS-UCS変換表|http://wakaba-web.hp.infoseek.co.jp/table/jis-note.ja.html]」。JIS X 0208/0213とUCS (Unicode)との対応表があります。JIS X 0213:2004で訂正された情報が反映されていないので要注意です。下記参照。
- 丸付き数字 -
!!Unicodeにおける丸付き数字
- 規格票・関連文献等 -
*日本規格協会から『増補改訂 JIS漢字字典』(ISBN:4-542-20129-5) が発売されました。 JIS第1〜第4水準までの全漢字・非漢字を収録しています。 JISの符号位置だけでなく、UCS (Unicode)との対応や、字形例、それに大量の人名・地名用例などの情報が得られます。旧版と比較すると、非漢字が本格的に取り込まれたのが大きな特徴といえます。非漢字に対しても、形の似た文字への参照や用法の説明など、実装に役立つ情報が盛り込まれています。 また、JIS X 0208:1997、JIS X 0213:2000の縮刷版を一部収録しています。ただし2004年版の情報は未収録であり、UCSとの対応ではいわゆる「カッコつきUCS」が一部そのまま載っている点など注意が必要です。→「JIS漢字字典補足」も参照のこと
- 人名用漢字 -
!!Unicodeと人名用漢字
- 双柱 -
双柱とは、垂直線を2本並べた記号です。印刷物において区切りの記号として用いられます。JIS X 0208 (したがってJIS X 0213も) やUnicodeで符号位置が与えられています。
- 濁点 -
!! Unicodeにおける濁点
- 波ダッシュ -
!!Unicodeにおける波ダッシュ
- 波ダッシュ問題 -
波ダッシュ問題とは、Shift_JISやEUC-JPのようなJIS X 0208ベースのコードからUnicodeに変換する際に、一部の記号の対応するUnicode符号位置がおかしいコード変換の実装がある問題を指します。記号の文字化けの原因となっています。この問題に現れる代表的な記号が波ダッシュであることから、波ダッシュ問題といいます。
- 半濁点 -
!! Unicodeにおける半濁点
- 鼻濁音 -
!!鼻濁音表記とUnicode
- 表外漢字UCS互換 -
これにより符号表の例示字形の変更が行われることになりました。包摂規準の範囲内の字体差であることから多くの文字については問題なかったのですが、一部に、例示字形を変えると[[ISO/IEC 10646]] (Unicode)との対応関係に問題を生じるものがありました。
- 符号位置 -
!!UnicodeおよびISO/IEC 10646における符号位置
- 文字名 -
文字名とは、[[ISO/IEC 10646]]ならびにUnicodeにおいて各文字(符号位置)に与えられた名前です。ラテン大文字で付けられています。
- 包摂 -
例えば、「逢」という字のしんにょうの点の数は1つでも2つでもあり得ますが、JIS X 0213やUnicodeといった文字コードではこうした1点しんにょう・2点しんにょうの字体を区別せずに同じ符号位置に対応させます。JIS X 0213なら1-16-9、UnicodeならU+9022です。