私はpython CSVファイルから入力を取得し、それを辞書形式にプッシュするスクリプトを記述しようとしています。(Python = 3.x)。
私は以下のコードを使用してCSVファイルを読み取りますが、それは機能します:
import csv
reader = csv.reader(open('C:\\Users\\Chris\\Desktop\\test.csv'), delimiter=',', quotechar='|')
for row in reader:
print(', '.join(row))
しかし、結果を辞書に入れたいと思います。 CSVファイルの最初の行をディクショナリの「キー」フィールドとして使用し、CSVファイルの後続の行でデータ部分を埋めたいと思います。
サンプルデータ:
Date First Name Last Name Score
12/28/2012 15:15 John Smith 20
12/29/2012 15:15 Alex Jones 38
12/30/2012 15:15 Michael Carpenter 25
このコードでやりたいことが他にもありますが、今のところは辞書を機能させるだけが探しています。
誰でもこれで私を助けることができますか?
編集バージョン2:
import csv
reader = csv.DictReader(open('C:\\Users\\Chris\\Desktop\\test.csv'))
result = {}
for row in reader:
for column, value in row.items():
result.setdefault(column, []).append(value)
print('Column -> ', column, '\nValue -> ', value)
print(result)
fieldnames = result.keys()
csvwriter = csv.DictWriter(open('C:\\Users\\Chris\\Desktop\\test_out.csv', 'w'), delimiter=',', fieldnames=result.keys())
csvwriter.writerow(dict((fn,fn) for fn in fieldnames))
for row in result.items():
print('Values -> ', row)
#csvwriter.writerow(row)
'''
Test output
'''
test_array = []
test_array.append({'fruit': 'Apple', 'quantity': 5, 'color': 'red'});
test_array.append({'fruit': 'pear', 'quantity': 8, 'color': 'green'});
test_array.append({'fruit': 'banana', 'quantity': 3, 'color': 'yellow'});
test_array.append({'fruit': 'orange', 'quantity': 11, 'color': 'orange'});
fieldnames = ['fruit', 'quantity', 'color']
test_file = open('C:\\Users\\Chris\\Desktop\\test_out.csv','w')
csvwriter = csv.DictWriter(test_file, delimiter=',', fieldnames=fieldnames)
csvwriter.writerow(dict((fn,fn) for fn in fieldnames))
for row in test_array:
print(row)
csvwriter.writerow(row)
test_file.close()
辞書を作成し、結果を反復処理して、辞書に行を詰めます。日付が重複している行に遭遇した場合、何をするかを決定する必要があることに注意してください(例外を発生させる、前の行を置き換える、後の行を破棄するなど)
Test.csvは次のとおりです。
Date,Foo,Bar
123,456,789
abc,def,ghi
および対応するプログラム:
import csv
reader = csv.reader(open('test.csv'))
result = {}
for row in reader:
key = row[0]
if key in result:
# implement your duplicate row handling here
pass
result[key] = row[1:]
print result
収量:
{'Date': ['Foo', 'Bar'], '123': ['456', '789'], 'abc': ['def', 'ghi']}
または、DictReaderを使用:
import csv
reader = csv.DictReader(open('test.csv'))
result = {}
for row in reader:
key = row.pop('Date')
if key in result:
# implement your duplicate row handling here
pass
result[key] = row
print result
結果:
{'123': {'Foo': '456', 'Bar': '789'}, 'abc': {'Foo': 'def', 'Bar': 'ghi'}}
または、列見出しをその列の値のリストにマップすることもできます。
import csv
reader = csv.DictReader(open('test.csv'))
result = {}
for row in reader:
for column, value in row.iteritems():
result.setdefault(column, []).append(value)
print result
その結果:
{'Date': ['123', 'abc'], 'Foo': ['456', 'def'], 'Bar': ['789', 'ghi']}
Python DictReader クラスが必要です。詳細なヘルプは here
import csv
with open('file_name.csv', 'rt') as f:
reader = csv.DictReader(f)
for row in reader:
print row
@ phil-frostからのヘルプは非常に役に立ち、まさに私が探していたものでした。
その後、いくつかの調整を行いましたので、ここで共有したいと思います。
def csv_as_dict(file, ref_header, delimiter=None):
import csv
if not delimiter:
delimiter = ';'
reader = csv.DictReader(open(file), delimiter=delimiter)
result = {}
for row in reader:
print(row)
key = row.pop(ref_header)
if key in result:
# implement your duplicate row handling here
pass
result[key] = row
return result
あなたはそれを呼び出すことができます:
myvar = csv_as_dict(csv_file, 'ref_column')
Ref_columは、各行のメインキーです。
Apache Solr の使用を検討しましたか?検索スコアリングをサポートし、CSVファイルデータを簡単に使用します。驚くほどの拡張性があり、データを分析するためのその他のオプションが多数あることがわかります。たとえば、複数の言語のサポートやスペルミスのクエリなどです。
例