Python二重引用符付きのカンマを無視してCSVを解析

Question

次のような行を含むCSVファイルがあります。

"AAA", "BBB", "Test, Test", "CCC" "111", "222, 333", "XXX", "YYY, ZZZ"

等々 ...

二重引用符の下にあるコンマを解析したくありません。すなわち。私の期待される結果は

AAA BBB Test, Test CCC

私のコード：

import csv with open('values.csv', 'rb') as f: reader = csv.reader(f) for row in reader: print row

私はpythonの下でcsvパッケージを使用しようとしましたが、運はありません。解析はすべてのコンマを爆発させます。

何か足りない場合は教えてください

Michael · Accepted Answer

これはする必要があります：

lines = '''"AAA", "BBB", "Test, Test", "CCC" "111", "222, 333", "XXX", "YYY, ZZZ"'''.splitlines() for l in csv.reader(lines, quotechar='"', delimiter=',', quoting=csv.QUOTE_ALL, skipinitialspace=True): print l >>> ['AAA', 'BBB', 'Test, Test', 'CCC'] >>> ['111', '222, 333', 'XXX', 'YYY, ZZZ']

Martijn Pieters · Answer

入力の引用文字の前にスペースがあります。 skipinitialspaceをTrue に設定して、区切り文字に続く空白をスキップします。

Trueの場合、delimiterの直後の空白は無視されます。デフォルトはFalseです。

>>> import csv >>> lines = '''\ ... "AAA", "BBB", "Test, Test", "CCC" ... "111", "222, 333", "XXX", "YYY, ZZZ" ... ''' >>> reader = csv.reader(lines.splitlines()) >>> next(reader) ['AAA', ' "BBB"', ' "Test', ' Test"', ' "CCC"'] >>> reader = csv.reader(lines.splitlines(), skipinitialspace=True) >>> next(reader) ['AAA', 'BBB', 'Test, Test', 'CCC']