トップ 一覧 検索 ヘルプ RSS ログイン

検索

キーワード AND OR
  • CP932 - * Unicodeとの変換が間違っている波ダッシュ問題
  • EUC-JIS-2004 - これによってUTF-8のファイルutf8.txtをEUCにコード変換してファイルeuc.txtに書き出します。変換方向を逆にするには -f と -t の指定を入れ替えます。EUCとUTF-8の間で変換するには、常にこのやり方を用いるのが適当です。これはWindowsの実装にある波ダッシュ問題を引き起こさず、また丸付き数字やローマ数字を救済できます。EUCのコード変換には常にこれを用いるのがおすすめです。
  • JIS X 0208 - 対応づける実装が存在します。このような実装は文字化けの元になっており、波ダッシュ問題として知られています。
  • Shift_JIS - * ベンダの実装によっては、Unicodeとの変換において、いくつかの記号がJISの定義と異なる間違った文字に変換するものがある (波ダッシュ問題)
  • iconv - これはCP932の波ダッシュ問題を引き起こさず、またWindowsの丸付き数字やローマ数字を救済できます。
  • チルダ - (1区33点の波ダッシュ WAVE DASH をUnicodeのFULLWIDTH TILDEに移す実装は誤りで (世間でいう波ダッシュ問題)、FULLWIDTH TILDEはEUC-JIS-2004におけるJIS X 0213のチルダやEUC-JPにおけるJIS X 0212のチルダがASCIIの7/14と重複するため用いるもの)
  • 丸付き数字 - これで、Windowsの丸付き数字を救済でき、なおかつ、CP932と違って波ダッシュ問題を引き起こしません。もちろん、第3第4水準漢字にも対応します。
  • 双柱 - * 波ダッシュ問題
  • 波ダッシュ - ただし、一部のコード変換の実装ではJISの波ダッシュを誤ってU+FF5E (FULLWIDTH TILDE, 「全角チルダ」)に対応づけてしまうものがあり、文字化けの原因となっています。これが世に言う波ダッシュ問題です。
  • 波ダッシュ問題 - 波ダッシュ問題