私はその文字セットが8859-9であるウェブページを持っています、そしてそれは文字エンコードASCIIでウィンドウで準備されました。 ftpアクセスから、ubuntuでgeditを介して開き、トルコ語の文字が次のように変更されます(トルコ語のıがýになりました)。このような愚かなことを避けるために私は何ができますか?
ロケールをtr_TR.ISO-8859-9
に設定してみましたか
現在のロケールを確認するには、引数なしでlocale
コマンドを使用します。 LANGUAGEを除く、関連するすべての環境変数の値を出力します。 locale charmap
は、現在のエンコーディングの名前を出力します。使用可能なロケールを確認するには、locale -a
と入力します。使用可能なエンコーディングを確認するには、locale -m
と入力します。
Geditのファイルを開くダイアログを使用する場合は、開くファイルに適切なエンコーディングを選択できます。
上記が役に立たない場合は、file filename
の出力とhexdump -C filename
の出力の10relevant行で質問を更新してください
このような愚かなことを避けるために私は何ができますか?
いつでもどこでもすべてにutf-8を使用してください。 iconv
またはrecode
を使用して、utf-8以外のものをutf-8に変換します。使用するすべてのフォントが、使用する scripts をサポートしていることを確認してください(つまり、関連するUnicode範囲のグリフがあります)。
iconv
で変換できます。
$ iconv -f iso-8859-1 -t utf-8 somefile.latin1 > somefile.utf8
$
iconv
の代わりに、recode
を使用します。まだわかっていない場合は、file
コマンドで文字セットを見つけることができます。
$ file somefile.latin1
somefile.latin1: ISO-8859 text
$