web-dev-qa-db-ja.com

CSVファイルのエンコードを確認する方法

CSVファイルがあり、そのエンコードを理解したいと思います。 Microsoft Excelにそれを検出するのに役立つメニューオプションがありますか

または、C#やPHPなどのプログラミング言語を使用して推測する必要がありますか。

35
Vipul

メモ帳を使用してファイルを開き、[ファイル]-> [名前を付けて保存]に移動するだけです。 [保存]ボタンの横にエンコードドロップダウンがあり、ファイルの現在のエンコードが選択されます。

40
CamW

Linuxシステムでは、fileコマンドを使用できます。正しいエンコーディングを提供します

サンプル:

file blah.csv

出力:

blah.csv: ISO-8859 text, with very long lines
26
Jitender Kumar

Pythonを使用する場合は、print()関数を使用してcsvファイルのエンコードを確認するだけです。例えば:

with open('file_name.csv') as f:
    print(f)

出力は次のようになります。

<_io.TextIOWrapper name='file_name.csv' mode='r' encoding='utf8'>
14
Alineat

chardethttps://github.com/chardet/chardet を使用します(ドキュメントは短く読みやすいです)。

Pythonをインストールしてから、pip install chardetを実行し、最後にコマンドラインコマンドを使用します。

GB2312でテストしましたが、かなり正確です。 (少なくとも数文字あることを確認してください。1文字のみのサンプルは失敗する可能性があります)。

fileは、ご覧のとおり信頼性がありません。

enter image description here

2
Rick