{{category プログラミング}} !!![Python|http://www.python.org/] プログラミング言語Pythonはバージョン2.4からJIS X 0213を標準でサポート しています。codecで、EUC-JIS-2004, ISO-2022-JP-2004, Shift_JIS-2004が 使用できます。 以前から、Pythonで日中韓の文字コードを扱うCJKCodecsというモジュールが 配布されていましたが、それがPython本体に取り込まれたということのようです。 !!コード例 例えば、下記のようなコードで、「EUC-JIS-2004で符号化されたファイルを1行ずつ 読み込み、各行の先頭にビュレット(箇条書きの頭に打つ、中ぐらいの大きさの点。 面区点番号1-03-32)を付加し、Shift_JIS-2004に変換して出力する」といった 処理が可能です。 #!/usr/local/bin/python import sys, codecs dec = codecs.lookup('euc-jis-2004')[1] f1 = open(sys.argv[1], 'r') f2 = open(sys.argv[2], 'w') while 1: s = f1.readline() if not s: break unicode_obj = dec(s)[0] unicode_obj = u'\u2022' + unicode_obj f2.write(unicode_obj.encode('shift_jis-2004')) f1.close f2.close !参考 上のコードは以下のページを参考にしました。 *[ファイル入出力|http://zope.lab.tkikuchi.net/edu/coreinfo03/10File.html] *[XML.com: Unicode Secrets|http://www.xml.com/pub/a/2005/05/18/unicode.html] !!関連項目 * PHP - Web開発に用いられる軽量言語 * Ruby - Web開発に用いられる軽量言語