トップ 新規 編集 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

Ruby

[カテゴリ:プログラミング]

Ruby

Ruby 2.0

プログラミング言語Rubyのバージョン2.0では、JIS X 0213の符号化方式のひとつEUC-JIS-2004に対応しました。

文字コードの名前として "EUC-JIS-2004" という名前で入っています。文字コードを指定する場面でこの名前を指定すればOKです。Ruby 2.0では"EUC-JP-2004" となっていましたが、2.1.3で "EUC-JIS-2004" に修正されました。

JavaPython等と異なり、内部処理用にUnicodeに変換するのでなく、EUC-JIS-2004のコード自体を直接処理することができます。Unicodeとの変換も可能です。

一方、過去のバージョンで使用できたIconvクラスは2.0では削除されているので、これを利用してEUC-JIS-2004Shift_JIS-2004のテキストデータを変換することはできなくなっています。

Ruby 1.8

Ruby 1.8系では、マニュアルには明記されていませんが下記の要領でJIS X 0213のコードを処理可能です。

  • 漢字コードがSJISの場合 (起動オプション -Ks): Shift_JIS-2004
  • 漢字コードがEUCの場合 (起動オプション -Ke): EUC-JIS-2004

いずれも、2面の文字も正規表現で「1文字」としてマッチします。

また、Iconvクラスによるコード変換で、Shift_JISX0213EUC-JISX0213ISO-2022-JP-3 が扱えます (呼び出すiconvの実装、バージョンに依存します)。

ただし、NKFクラスによるコード変換は使えません。(nkfJIS X 0213に対応していないため)

関連項目

  • Python - 同じくWeb開発に用いられる軽量言語
  • PHP - 同じくWeb開発に用いられる軽量言語

最終更新時間:2016年11月23日 21時42分10秒