検索
- EUC-JIS-2004 -
プログラミング言語のPython, Ruby, PHP, コード変換プログラムのiconv, nkf, テキストエディタのGNU Emacs等はこの符号化方式に対応しています。
- EUC-JISX0213 -
例えばiconvでは、EUC-JISX0213の名称でEUC-JIS-2004に対応しています。
- GNU C Library -
バージョン2.3以降で、文字コード変換の関数・コマンドのiconvでJIS X 0213の符号化方式(EUC-JISX0213, ISO-2022-JP-3, Shift_JISX0213)をサポートしています。
- HP-UX -
JIS X 0213の符号化方式であるShift_JIS-2004, EUC-JIS-2004とUnicodeとの間の変換をiconvコマンド/ライブラリで行うことができます。
- ISO-2022-JP-2004 -
テキストエディタのGNU Emacs, プログラミング言語のPython, PHP, 文字コード変換プログラムのiconv, AnyTran, RACCOON等はこの符号化方式に対応しています。
- Ruby -
一方、過去のバージョンで使用できたIconvクラスは2.0では削除されているので、
- Shift_JIS -
コード変換の際に、例えばiconvではこう指定します。
- Shift_JIS-2004 -
Mac OS Xや、プログラミング言語のPython, Java, PHP, コード変換プログラムのiconv, nkf, テキストエディタのGNU Emacs等はこの符号化方式に対応しています。
- Shift_JISX0213 -
例えばiconvでは、SHIFT_JISX0213の名称でShift_JIS-2004に対応しています。
- UTF-8 -
iconvコマンドでShift_JIS-2004のテキストデータをUTF-8に変換するには次のようにします。SJISからUTF-8に変換するときは常にこの指定を用いるのがおすすめです。
- iconv - iconv
- libiconv - libiconv
- nkf -
* iconv
- アイヌ語 -
コード変換でも、Shift_JIS-2004あるいはEUC-JIS-2004を用いることが必要です。例えば、UTF-8のファイルをiconvコマンドでSJISに変換するときは下記のようにするとアイヌ語も大丈夫です。
- 外字 -
例えば、UTF-8とSJISの間でコード変換をするときには、JIS X 0208ベースのShift_JISでなく、拡張規格のJIS X 0213ベースのShift_JIS-2004を指定すれば、丸付き数字やローマ数字はもちろん、専門用語や地名などに使われる第3第4水準漢字や、アクセント付きのラテン文字、英和辞典に用いられる発音記号、著作権表示記号など各種記号類も文字化けせずに使用できます。iconvコマンドでコード変換するときはこうします:
- 丸付き数字 -
iconvでSJISからUTF-8に変換するには次のようにします。
- 双柱 -
双柱を正しくUnicodeに変換するには、Shift_JIS や Shift_JISX0213, Shift_JIS-2004と指定すると良いでしょう。例えばiconvコマンドでは次のように指定します。
- 波ダッシュ問題 -
この観点から最も推奨されるのは、Shift_JIS-2004 (Shift_JISX0213)の変換を用いることです。例えばiconvコマンドでは下記のようなオプション指定にてシフトJISからUTF-8へ変換します。