検索
- CP932 -
* Unicodeとの変換が間違っている波ダッシュ問題
- EUC-JIS-2004 -
これによってUTF-8のファイルutf8.txtをEUCにコード変換してファイルeuc.txtに書き出します。変換方向を逆にするには -f と -t の指定を入れ替えます。EUCとUTF-8の間で変換するには、常にこのやり方を用いるのが適当です。これはWindowsの実装にある波ダッシュ問題を引き起こさず、また丸付き数字やローマ数字を救済できます。EUCのコード変換には常にこれを用いるのがおすすめです。
- JIS X 0208 -
対応づける実装が存在します。このような実装は文字化けの元になっており、波ダッシュ問題として知られています。
- Shift_JIS -
* ベンダの実装によっては、Unicodeとの変換において、いくつかの記号がJISの定義と異なる間違った文字に変換するものがある (波ダッシュ問題)
- iconv -
これはCP932の波ダッシュ問題を引き起こさず、またWindowsの丸付き数字やローマ数字を救済できます。
- チルダ -
(1区33点の波ダッシュ WAVE DASH をUnicodeのFULLWIDTH TILDEに移す実装は誤りで (世間でいう波ダッシュ問題)、FULLWIDTH TILDEはEUC-JIS-2004におけるJIS X 0213のチルダやEUC-JPにおけるJIS X 0212のチルダがASCIIの7/14と重複するため用いるもの)
- 丸付き数字 -
これで、Windowsの丸付き数字を救済でき、なおかつ、CP932と違って波ダッシュ問題を引き起こしません。もちろん、第3第4水準漢字にも対応します。
- 双柱 -
* 波ダッシュ問題
- 波ダッシュ -
ただし、一部のコード変換の実装ではJISの波ダッシュを誤ってU+FF5E (FULLWIDTH TILDE, 「全角チルダ」)に対応づけてしまうものがあり、文字化けの原因となっています。これが世に言う波ダッシュ問題です。
- 波ダッシュ問題 - 波ダッシュ問題