トップ 差分 一覧 ソース 検索 ヘルプ PDF RSS ログイン

Python

[カテゴリ:プログラミング]

Python

プログラミング言語Pythonはバージョン2.4からJIS X 0213を標準でサポートしています。codecで、EUC-JIS-2004, ISO-2022-JP-2004, Shift_JIS-2004が使用できます。

以前から、Pythonで日中韓の文字コードを扱うCJKCodecsというモジュールが配布されていましたが、それがPython本体に取り込まれたということのようです。

コード例

例えば、下記のようなコードで、「EUC-JIS-2004で符号化されたファイルを1行ずつ読み込み、各行の先頭にビュレット(箇条書きの頭に打つ、中ぐらいの大きさの点。面区点番号1-03-32)を付加し、Shift_JIS-2004に変換して出力する」といった処理が可能です。

 #!/usr/local/bin/python
 import sys, codecs
 
 dec = codecs.lookup('euc-jis-2004')[1]
 
 f1 = open(sys.argv[1], 'r')
 f2 = open(sys.argv[2], 'w')
 while 1:
       s = f1.readline()
 	if not s:
 		break
 	unicode_obj = dec(s)[0]
 	unicode_obj = u'\u2022' + unicode_obj
 	f2.write(unicode_obj.encode('shift_jis-2004'))
 f1.close
 f2.close

参考

上のコードは以下のページを参考にしました。

関連項目

  • PHP - Web開発に用いられる軽量言語
  • Ruby - Web開発に用いられる軽量言語

最終更新時間:2016年11月23日 18時55分04秒