検索
- CP932 -
13区の記号類、例えば丸付き数字やローマ数字、「TEL」などの組み文字はそのままJIS X 0213の漢字集合1面に取り入れられています。
- EUC-JIS-2004 -
これによってUTF-8のファイルutf8.txtをEUCにコード変換してファイルeuc.txtに書き出します。変換方向を逆にするには -f と -t の指定を入れ替えます。EUCとUTF-8の間で変換するには、常にこのやり方を用いるのが適当です。これはWindowsの実装にある波ダッシュ問題を引き起こさず、また丸付き数字やローマ数字を救済できます。EUCのコード変換には常にこれを用いるのがおすすめです。
- JIS X 0213 -
このうち漢字集合1面がJIS X 0208の上位互換です。平仮名・片仮名やダイアクリティカルマーク付きラテン文字、丸付き数字や記号類といった非漢字、それに比較的使用頻度の高い第3水準漢字が追加されています。
- Shift_JIS -
Shift_JISには各社のベンダ定義外字を空き領域に追加した亜種がありますが(例えばWindowsのCP932ないしWindows-31J)、規格違反の実装でありShift_JIS-2004との互換性がなく(一部の丸付き数字等の非漢字除く)、またJIS X 0208の欠点を補うには量・質ともにあまりにも不十分であり、二重符号化(ひどい場合には三重符号化)の問題さらにはUnicodeとの変換がおかしいという問題を持つものもあるため、使うべきではありません。
- Shift_JIS-2004 -
Windowsのベンダ定義外字の丸付き数字やローマ数字も救済でき、かつ、波ダッシュを正しい符号位置(U+301C)に変換します。波ダッシュだけでなく、双柱や負符号なども文字化けせず正しく変換します。
- Unicode正規化 -
Unicodeの正規化には4種類あります。NFC, NFD, NFKC, NFKDの各形式です。名前に「C(omposition)」のつく形式は、合成済みの符号位置に極力そろえるもの、「D(ecomposition)」は分解した表現にそろえるものです。「K」のついたものは、(いわゆる)全角英数字を通常の英数字にそろえたり、あるいは丸付き数字をただの数字に変えるなどの変更を行います。
- iconv -
これはCP932の波ダッシュ問題を引き起こさず、またWindowsの丸付き数字やローマ数字を救済できます。
- 外字 -
例えば、丸付き数字はJIS X 0208にないので、この文字コードにとっては、符号化できない外字となります。これが上記1番目の意味です。(JIS X 0213やUnicodeには丸付き数字はあるので、これらの文字コードにとっては外字ではありません)
- 漢字集合1面 -
**丸付き数字やローマ数字等、Windowsのベンダ定義外字(CP932)と互換の記号類
- 丸付き数字 - 丸付き数字
- 国内実装互換 -
13区にある、丸付き数字、ローマ数字、「(株)」、「TEL」といった組み文字等が該当します。