Python
Python
プログラミング言語Pythonはバージョン2.4からJIS X 0213を標準でサポートしています。codecで、EUC-JIS-2004, ISO-2022-JP-2004, Shift_JIS-2004が使用できます。
以前から、Pythonで日中韓の文字コードを扱うCJKCodecsというモジュールが配布されていましたが、それがPython本体に取り込まれたということのようです。
コード例
例えば、下記のようなコードで、「EUC-JIS-2004で符号化されたファイルを1行ずつ読み込み、各行の先頭にビュレット(箇条書きの頭に打つ、中ぐらいの大きさの点。面区点番号1-03-32)を付加し、Shift_JIS-2004に変換して出力する」といった処理が可能です。
#!/usr/local/bin/python import sys, codecs dec = codecs.lookup('euc-jis-2004')[1] f1 = open(sys.argv[1], 'r') f2 = open(sys.argv[2], 'w') while 1: s = f1.readline() if not s: break unicode_obj = dec(s)[0] unicode_obj = u'\u2022' + unicode_obj f2.write(unicode_obj.encode('shift_jis-2004')) f1.close f2.close
参考
上のコードは以下のページを参考にしました。
最終更新時間:2016年11月23日 18時55分04秒