検索
- CJK統合漢字 -
特に、BMP外、面02の拡張Bにもあるため、JIS X 0213の文字全てを正しく扱うには、UTF-16ではサロゲート・ペアの、UTF-8では4バイトのコードの処理が正しく出来ることが必要です。
- EUC-JIS-2004 -
例えば、MacのコマンドラインやWindowsのCygwinでiconvを使ってUTF-8との間でコード変換するには下記のようにします。文字コード名「EUC-JISX0213」によってEUC-JIS-2004を指定できます。
- Emacs -
しかし、jisx0208に含まれず、jisx0213で新たに含まれた文字をutf-8などで保存したり、逆に読んだりすることはできません。
- GNU C Library -
もちろん、UTF-8やUTF-16といったUnicodeの符号化方式との間で変換することもできます。
- Gauche -
変換が可能です。UTF-8との変換も可能です。
- JIS第3・第4水準漢字を用いる三国志人名リスト -
UTF-8, Shift_JIS-2004, EUC-JIS-2004の3つの文字コードで提供されています。
- RACCOON -
* [RACCOON 特長|http://www.dal.co.jp/products/dhp/raccoon/feature.html] - 対応している文字コードの記載があります。Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004が、UTF-8やUTF-16等とともに挙げられています。
- Shift_JIS -
iconv -f SHIFT_JIS -t UTF-8 < sjis.txt > utf8.txt
- Shift_JIS-2004 -
例えば、iconvコマンドでShift_JIS-2004からUTF-8に変換するには下記のようにします。
- Shift_JISX0213 -
コード変換のコマンドライン例を示します。UTF-8のテキストファイル utf8.txt を読み込んで文字コードを Shift_JISX0213 (Shift_JIS-2004)に変換し、ファイル sjis.txt に出力します。SJISに変換するのには、第2水準までしか対応しないSHIFT_JIS等でなく、常にこの指定を用いるのがおすすめです。
- UNICODE2SJIS2004 -
レアアースさん作のWindows用のコード変換プログラム[UNICODE2SJIS2004|http://hp.vector.co.jp/authors/VA018305/u2j2.html]は、Unicode (UTF-8, UTF-16, UTF-32) からShift_JIS-2004あるいはShift_JISX0213に変換することができます。
- UTF-16 -
* UTF-8
- UTF-8 - UTF-8
- Unicode -
またUTF-8では漢字は通常3バイトですが、面02の漢字は4バイトの長さになります。
- iconv -
例えば、Shift_JISからUTF-8に変換するにはこうします。
- libiconv -
例えば、SJISからUTF-8に変換するには次のようなコマンドラインになります。
- アイヌ語 -
OSに付属のテキストエディットで入力すると、テキストをそのままShift_JIS-2004 (Shift JIS X0213) やUTF-8で保存できます。
- 改定された常用漢字とJIS漢字コード規格 -
こうした文字は、JIS X 0213の符号化方式のEUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004、あるいはUnicodeの符号化方式のUTF-8, UTF-16, UTF-32を使うと符号化できます。
- 外字 -
例えば、UTF-8とSJISの間でコード変換をするときには、JIS X 0208ベースのShift_JISでなく、拡張規格のJIS X 0213ベースのShift_JIS-2004を指定すれば、丸付き数字やローマ数字はもちろん、専門用語や地名などに使われる第3第4水準漢字や、アクセント付きのラテン文字、英和辞典に用いられる発音記号、著作権表示記号など各種記号類も文字化けせずに使用できます。iconvコマンドでコード変換するときはこうします:
- 丸付き数字 -
iconvでSJISからUTF-8に変換するには次のようにします。
- 双柱 -
iconv -f SHIFT_JISX0213 -t UTF-8 < sjis.txt > utf8.txt
- 日医標準レセプトソフト -
外部的な符号化にはUTF-8を使用していますが、
- 波ダッシュ問題 -
この観点から最も推奨されるのは、Shift_JIS-2004 (Shift_JISX0213)の変換を用いることです。例えばiconvコマンドでは下記のようなオプション指定にてシフトJISからUTF-8へ変換します。