トップ 新規 一覧 検索 ヘルプ RSS ログイン

検索

キーワード AND OR
  • CJK統合漢字 - 特に、BMP外、面02の拡張Bにもあるため、JIS X 0213の文字全てを正しく扱うには、UTF-16ではサロゲート・ペアの、UTF-8では4バイトのコードの処理が正しく出来ることが必要です。
  • EUC-JIS-2004 - 例えば、MacのコマンドラインやWindowsのCygwinでiconvを使ってUTF-8との間でコード変換するには下記のようにします。文字コード名「EUC-JISX0213」によってEUC-JIS-2004を指定できます。
  • Emacs - しかし、jisx0208に含まれず、jisx0213で新たに含まれた文字をutf-8などで保存したり、逆に読んだりすることはできません。
  • GNU C Library - もちろん、UTF-8やUTF-16といったUnicodeの符号化方式との間で変換することもできます。
  • Gauche - 変換が可能です。UTF-8との変換も可能です。
  • JIS第3・第4水準漢字を用いる三国志人名リスト - UTF-8, Shift_JIS-2004, EUC-JIS-2004の3つの文字コードで提供されています。
  • RACCOON - * [RACCOON 特長|http://www.dal.co.jp/products/dhp/raccoon/feature.html] - 対応している文字コードの記載があります。Shift_JIS-2004, EUC-JIS-2004, ISO-2022-JP-2004が、UTF-8やUTF-16等とともに挙げられています。
  • Shift_JIS - iconv -f SHIFT_JIS -t UTF-8 < sjis.txt > utf8.txt
  • Shift_JIS-2004 - 例えば、iconvコマンドでShift_JIS-2004からUTF-8に変換するには下記のようにします。
  • Shift_JISX0213 - コード変換のコマンドライン例を示します。UTF-8のテキストファイル utf8.txt を読み込んで文字コードを Shift_JISX0213 (Shift_JIS-2004)に変換し、ファイル sjis.txt に出力します。SJISに変換するのには、第2水準までしか対応しないSHIFT_JIS等でなく、常にこの指定を用いるのがおすすめです。
  • UNICODE2SJIS2004 - レアアースさん作のWindows用のコード変換プログラム[UNICODE2SJIS2004|http://hp.vector.co.jp/authors/VA018305/u2j2.html]は、Unicode (UTF-8, UTF-16, UTF-32) からShift_JIS-2004あるいはShift_JISX0213に変換することができます。
  • UTF-16 - * UTF-8
  • UTF-8 - UTF-8
  • Unicode - またUTF-8では漢字は通常3バイトですが、面02の漢字は4バイトの長さになります。
  • iconv - 例えば、Shift_JISからUTF-8に変換するにはこうします。
  • libiconv - 例えば、SJISからUTF-8に変換するには次のようなコマンドラインになります。
  • アイヌ語 - OSに付属のテキストエディットで入力すると、テキストをそのままShift_JIS-2004 (Shift JIS X0213) やUTF-8で保存できます。
  • 改定された常用漢字とJIS漢字コード規格 - こうした文字は、JIS X 0213の符号化方式のEUC-JIS-2004, Shift_JIS-2004, ISO-2022-JP-2004、あるいはUnicodeの符号化方式のUTF-8, UTF-16, UTF-32を使うと符号化できます。
  • 外字 - 例えば、UTF-8とSJISの間でコード変換をするときには、JIS X 0208ベースのShift_JISでなく、拡張規格のJIS X 0213ベースのShift_JIS-2004を指定すれば、丸付き数字やローマ数字はもちろん、専門用語や地名などに使われる第3第4水準漢字や、アクセント付きのラテン文字、英和辞典に用いられる発音記号、著作権表示記号など各種記号類も文字化けせずに使用できます。iconvコマンドでコード変換するときはこうします:
  • 丸付き数字 - iconvでSJISからUTF-8に変換するには次のようにします。
  • 双柱 - iconv -f SHIFT_JISX0213 -t UTF-8 < sjis.txt > utf8.txt
  • 日医標準レセプトソフト - 外部的な符号化にはUTF-8を使用していますが、
  • 波ダッシュ問題 - この観点から最も推奨されるのは、Shift_JIS-2004 (Shift_JISX0213)の変換を用いることです。例えばiconvコマンドでは下記のようなオプション指定にてシフトJISからUTF-8へ変換します。