トップ 一覧 検索 ヘルプ RSS ログイン

検索

キーワード AND OR
  • EUC-JIS-2004 - プログラミング言語のPython, Ruby, PHP, コード変換プログラムのiconv, nkf, テキストエディタのGNU Emacs等はこの符号化方式に対応しています。
  • EUC-JISX0213 - 例えばiconvでは、EUC-JISX0213の名称でEUC-JIS-2004に対応しています。
  • GNU C Library - バージョン2.3以降で、文字コード変換の関数・コマンドのiconvでJIS X 0213の符号化方式(EUC-JISX0213, ISO-2022-JP-3, Shift_JISX0213)をサポートしています。
  • HP-UX - JIS X 0213の符号化方式であるShift_JIS-2004, EUC-JIS-2004とUnicodeとの間の変換をiconvコマンド/ライブラリで行うことができます。
  • ISO-2022-JP-2004 - テキストエディタのGNU Emacs, プログラミング言語のPython, PHP, 文字コード変換プログラムのiconv, AnyTran, RACCOON等はこの符号化方式に対応しています。
  • Ruby - 一方、過去のバージョンで使用できたIconvクラスは2.0では削除されているので、
  • Shift_JIS - コード変換の際に、例えばiconvではこう指定します。
  • Shift_JIS-2004 - Mac OS Xや、プログラミング言語のPython, Java, PHP, コード変換プログラムのiconv, nkf, テキストエディタのGNU Emacs等はこの符号化方式に対応しています。
  • Shift_JISX0213 - 例えばiconvでは、SHIFT_JISX0213の名称でShift_JIS-2004に対応しています。
  • UTF-8 - iconvコマンドでShift_JIS-2004のテキストデータをUTF-8に変換するには次のようにします。SJISからUTF-8に変換するときは常にこの指定を用いるのがおすすめです。
  • iconv - iconv
  • libiconv - libiconv
  • nkf - * iconv
  • アイヌ語 - コード変換でも、Shift_JIS-2004あるいはEUC-JIS-2004を用いることが必要です。例えば、UTF-8のファイルをiconvコマンドでSJISに変換するときは下記のようにするとアイヌ語も大丈夫です。
  • 外字 - 例えば、UTF-8とSJISの間でコード変換をするときには、JIS X 0208ベースのShift_JISでなく、拡張規格のJIS X 0213ベースのShift_JIS-2004を指定すれば、丸付き数字やローマ数字はもちろん、専門用語や地名などに使われる第3第4水準漢字や、アクセント付きのラテン文字、英和辞典に用いられる発音記号、著作権表示記号など各種記号類も文字化けせずに使用できます。iconvコマンドでコード変換するときはこうします:
  • 丸付き数字 - iconvでSJISからUTF-8に変換するには次のようにします。
  • 双柱 - 双柱を正しくUnicodeに変換するには、Shift_JIS や Shift_JISX0213, Shift_JIS-2004と指定すると良いでしょう。例えばiconvコマンドでは次のように指定します。
  • 波ダッシュ問題 - この観点から最も推奨されるのは、Shift_JIS-2004 (Shift_JISX0213)の変換を用いることです。例えばiconvコマンドでは下記のようなオプション指定にてシフトJISからUTF-8へ変換します。