CSVファイルから辞書を作成する

Question

私はpython CSVファイルから入力を取得し、それを辞書形式にプッシュするスクリプトを記述しようとしています。（Python = 3.x）。

私は以下のコードを使用してCSVファイルを読み取りますが、それは機能します：

import csv reader = csv.reader(open('C:\Users\Chris\Desktop\test.csv'), delimiter=',', quotechar='|') for row in reader: print(', '.join(row))

しかし、結果を辞書に入れたいと思います。 CSVファイルの最初の行をディクショナリの「キー」フィールドとして使用し、CSVファイルの後続の行でデータ部分を埋めたいと思います。

サンプルデータ：

 Date First Name Last Name Score 12/28/2012 15:15 John Smith 20 12/29/2012 15:15 Alex Jones 38 12/30/2012 15:15 Michael Carpenter 25

このコードでやりたいことが他にもありますが、今のところは辞書を機能させるだけが探しています。

誰でもこれで私を助けることができますか？

編集バージョン2：

import csv reader = csv.DictReader(open('C:\Users\Chris\Desktop\test.csv')) result = {} for row in reader: for column, value in row.items(): result.setdefault(column, []).append(value) print('Column -> ', column, '
Value -> ', value) print(result) fieldnames = result.keys() csvwriter = csv.DictWriter(open('C:\Users\Chris\Desktop\test_out.csv', 'w'), delimiter=',', fieldnames=result.keys()) csvwriter.writerow(dict((fn,fn) for fn in fieldnames)) for row in result.items(): print('Values -> ', row) #csvwriter.writerow(row) ''' Test output ''' test_array = [] test_array.append({'fruit': 'Apple', 'quantity': 5, 'color': 'red'}); test_array.append({'fruit': 'pear', 'quantity': 8, 'color': 'green'}); test_array.append({'fruit': 'banana', 'quantity': 3, 'color': 'yellow'}); test_array.append({'fruit': 'orange', 'quantity': 11, 'color': 'orange'}); fieldnames = ['fruit', 'quantity', 'color'] test_file = open('C:\Users\Chris\Desktop\test_out.csv','w') csvwriter = csv.DictWriter(test_file, delimiter=',', fieldnames=fieldnames) csvwriter.writerow(dict((fn,fn) for fn in fieldnames)) for row in test_array: print(row) csvwriter.writerow(row) test_file.close()

Phil Frost · Accepted Answer

辞書を作成し、結果を反復処理して、辞書に行を詰めます。日付が重複している行に遭遇した場合、何をするかを決定する必要があることに注意してください（例外を発生させる、前の行を置き換える、後の行を破棄するなど）

Test.csvは次のとおりです。

Date,Foo,Bar 123,456,789 abc,def,ghi

および対応するプログラム：

import csv reader = csv.reader(open('test.csv')) result = {} for row in reader: key = row[0] if key in result: # implement your duplicate row handling here pass result[key] = row[1:] print result

収量：

{'Date': ['Foo', 'Bar'], '123': ['456', '789'], 'abc': ['def', 'ghi']}

または、DictReaderを使用：

import csv reader = csv.DictReader(open('test.csv')) result = {} for row in reader: key = row.pop('Date') if key in result: # implement your duplicate row handling here pass result[key] = row print result

結果：

{'123': {'Foo': '456', 'Bar': '789'}, 'abc': {'Foo': 'def', 'Bar': 'ghi'}}

または、列見出しをその列の値のリストにマップすることもできます。

import csv reader = csv.DictReader(open('test.csv')) result = {} for row in reader: for column, value in row.iteritems(): result.setdefault(column, []).append(value) print result

その結果：

{'Date': ['123', 'abc'], 'Foo': ['456', 'def'], 'Bar': ['789', 'ghi']}

Aamir Adnan · Answer

Python DictReader クラスが必要です。詳細なヘルプは here

import csv with open('file_name.csv', 'rt') as f: reader = csv.DictReader(f) for row in reader: print row

Pablo Daniel Estigarribia Davy · Answer

@ phil-frostからのヘルプは非常に役に立ち、まさに私が探していたものでした。

その後、いくつかの調整を行いましたので、ここで共有したいと思います。

def csv_as_dict(file, ref_header, delimiter=None): import csv if not delimiter: delimiter = ';' reader = csv.DictReader(open(file), delimiter=delimiter) result = {} for row in reader: print(row) key = row.pop(ref_header) if key in result: # implement your duplicate row handling here pass result[key] = row return result

あなたはそれを呼び出すことができます：

myvar = csv_as_dict(csv_file, 'ref_column')

Ref_columは、各行のメインキーです。

Mark O&#39;Connor · Answer

Apache Solr の使用を検討しましたか？検索スコアリングをサポートし、CSVファイルデータを簡単に使用します。驚くほどの拡張性があり、データを分析するためのその他のオプションが多数あることがわかります。たとえば、複数の言語のサポートやスペルミスのクエリなどです。

例

レポートを作成し、ダウンロードのためにサーバーにアップロードする
SOLR-csvファイルから2000万件のドキュメントをインポートするための最良のアプローチ