web-dev-qa-db-ja.com

Python二重引用符付きのカンマを無視してCSVを解析

次のような行を含むCSVファイルがあります。

"AAA", "BBB", "Test, Test", "CCC"
"111", "222, 333", "XXX", "YYY, ZZZ" 

等々 ...

二重引用符の下にあるコンマを解析したくありません。すなわち。私の期待される結果は

AAA
BBB
Test, Test
CCC

私のコード:

import csv
with open('values.csv', 'rb') as f:
    reader = csv.reader(f)
    for row in reader:
        print row

私はpythonの下でcsvパッケージを使用しようとしましたが、運はありません。解析はすべてのコンマを爆発させます。

何か足りない場合は教えてください

20
Abhiram Sampath

これはする必要があります:

lines = '''"AAA", "BBB", "Test, Test", "CCC"
           "111", "222, 333", "XXX", "YYY, ZZZ"'''.splitlines()
for l in  csv.reader(lines, quotechar='"', delimiter=',',
                     quoting=csv.QUOTE_ALL, skipinitialspace=True):
    print l
>>> ['AAA', 'BBB', 'Test, Test', 'CCC']
>>> ['111', '222, 333', 'XXX', 'YYY, ZZZ']
41
Michael

入力の引用文字の前にスペースがあります。 skipinitialspaceTrue に設定して、区切り文字に続く空白をスキップします。

Trueの場合、delimiterの直後の空白は無視されます。デフォルトはFalseです。

>>> import csv
>>> lines = '''\
... "AAA", "BBB", "Test, Test", "CCC"
... "111", "222, 333", "XXX", "YYY, ZZZ" 
... '''
>>> reader = csv.reader(lines.splitlines())
>>> next(reader)
['AAA', ' "BBB"', ' "Test', ' Test"', ' "CCC"']
>>> reader = csv.reader(lines.splitlines(), skipinitialspace=True)
>>> next(reader)
['AAA', 'BBB', 'Test, Test', 'CCC']
12
Martijn Pieters