CSVファイルがあり、そのエンコードを理解したいと思います。 Microsoft Excelにそれを検出するのに役立つメニューオプションがありますか
または、C#やPHPなどのプログラミング言語を使用して推測する必要がありますか。
メモ帳を使用してファイルを開き、[ファイル]-> [名前を付けて保存]に移動するだけです。 [保存]ボタンの横にエンコードドロップダウンがあり、ファイルの現在のエンコードが選択されます。
Linuxシステムでは、fileコマンドを使用できます。正しいエンコーディングを提供します
サンプル:
file blah.csv
出力:
blah.csv: ISO-8859 text, with very long lines
Pythonを使用する場合は、print()関数を使用してcsvファイルのエンコードを確認するだけです。例えば:
with open('file_name.csv') as f:
print(f)
出力は次のようになります。
<_io.TextIOWrapper name='file_name.csv' mode='r' encoding='utf8'>
chardethttps://github.com/chardet/chardet を使用します(ドキュメントは短く読みやすいです)。
Pythonをインストールしてから、pip install chardetを実行し、最後にコマンドラインコマンドを使用します。
GB2312でテストしましたが、かなり正確です。 (少なくとも数文字あることを確認してください。1文字のみのサンプルは失敗する可能性があります)。
file
は、ご覧のとおり信頼性がありません。