与えられた文字セットからUTF-8エンコーディングに変換したいテキストファイルがたくさんあります。
これを一気に行うために使用できるコマンドラインツールまたはPerl(または選択した言語)のいずれかがありますか。
iconvは多くの文字エンコーディング間の変換を行います。それでちょっとしたbashマジックを追加すれば、私たちは書くことができます
for file in *.txt; do
iconv -f ascii -t utf-8 "$file" -o "${file%.txt}.utf8.txt"
done
これは、iconv -f ascii -t utf-8
で終わるすべてのファイルに対して.txt
を実行し、記録されたファイルを、.utf8.txt
ではなく.txt
で終わる同じ名前のファイルに送信します。
ASCIIはUTF-8のサブセットなので、これが実際にあなたのファイルに何かをするわけではありませんが、エンコーディング間の変換方法についてのあなたの質問に答えることです。