web-dev-qa-db-ja.com

Pythonリストからの値で.csvファイルを作成します

私はPythonリストからの値で.csvファイルを作成しようとしています。リストの値を印刷すると、それらはすべてUnicode(?)です。つまり、次のようになります。

[u'value 1', u'value 2', ...]

リストの値、つまりfor v in mylist: print vを繰り返し処理すると、それらはプレーンテキストのように見えます。

そしてprint ','.join(mylist)でそれぞれの間に,を入れることができます

そして私はファイルに出力することができます。

myfile = open(...)
print >>myfile, ','.join(mylist)

しかし、私はCSVに出力し、リスト内の値の前後に区切り記号を付けたいと思います。

"value 1", "value 2", ... 

フォーマットにデリミタを含める簡単な方法は見つかりません。 joinステートメントを試してみました。これどうやってするの?

136
Fortilan
import csv

with open(..., 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)

編集:これはpython 2.xでのみ動作します。

Python 3.xで動作させるには、wbwに置き換えます( こちらのSO answerを参照

with open(..., 'wb', newline='') as myfile:
     wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
     wr.writerow(mylist)
201
Alex Martelli

これはAlex Martelliの安全版です。

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL)
    wr.writerow(mylist)
91
Cristian Garcia

私が見つけた最良の選択肢は、 savetxtモジュールnumpyを使うことです。

import numpy as np
np.savetxt("file_name.csv", data1, delimiter=",", fmt='%s', header=header)

あなたが積み重ねる必要がある複数のリストがある場合

np.savetxt("file_name.csv", np.column_stack((data1, data2)), delimiter=",", fmt='%s', header=header)
26
tokenizer_fsj

別の方法として、 DataFrame in pandas を使用することができます。そして、以下のコードのようにcsvにデータを簡単にダンプできます。

import pandas
df = pandas.DataFrame(data={"col1": list_1, "col2": list_2})
df.to_csv("./file.csv", sep=',',index=False)
23
Qy Zuo

カンマまたはタブ区切りファイルの読み書きには、pythonのcsvモジュールを使用してください。 csvモジュールはクォートを適切に制御できるので好ましいです。

例えば、これはあなたのためのうまくいった例です:

import csv
data = ["value %d" % i for i in range(1,4)]

out = csv.writer(open("myfile.csv","w"), delimiter=',',quoting=csv.QUOTE_ALL)
out.writerow(data)

を生成します。

"value 1","value 2","value 3"
12
vy32

この場合はstring.joinメソッドを使用できます。

明確にするために数行に分割します - これが対話型セッションです。

>>> a = ['a','b','c']
>>> first = '", "'.join(a)
>>> second = '"%s"' % first
>>> print second
"a", "b", "c"

または単一行として

>>> print ('"%s"') % '", "'.join(a)
"a", "b", "c"

ただし、文字列に引用符が埋め込まれているという問題がある可能性があります。このような場合、あなたはそれらをどのように逃げるかを決める必要があります。

CSVモジュール はあなたに代わってこの全ての面倒を見ることができます、あなたがいろいろな引用オプション(すべてのフィールド、引用符と区切り文字を持つフィールドだけ、数字以外のフィールドなど)とエスケープ方法の間で選ぶことができます制御文字(二重引用符、またはエスケープ文字列)。値が単純であれば、おそらくstring.joinで問題ありませんが、多くのEdgeケースを管理する必要がある場合は、利用可能なモジュールを使用してください。

7
Robert Christie

木星ノート

あなたのリストはAだとしましょう

その後、次の広告をcsvファイルとして作成できます(列のみ)。

R="\n".join(A)
f = open('Columns.csv','w')
f.write(R)
f.close()
2
rsc05

これはcsvモジュールを必要としない別の解決策です。

print ', '.join(['"'+i+'"' for i in myList])

例:

>>> myList = [u'value 1', u'value 2', u'value 3']
>>> print ', '.join(['"'+i+'"' for i in myList])
"value 1", "value 2", "value 3"

ただし、初期リストに ""が含まれている場合、それらはエスケープされません。必要な場合は、次のように関数を呼び出してエスケープすることができます。

print ', '.join(['"'+myFunction(i)+'"' for i in myList])
1
Richard

あなたは確かにCSVモジュールを使うべきですが、可能性は、あなたはunicodeを書く必要があります。 Unicodeを書く必要がある人のために、これはあなたがutilモジュールとして使用できる、example pageからのクラスです:

import csv, codecs, cStringIO

class UTF8Recoder:
    """
    Iterator that reads an encoded stream and reencodes the input to UTF-8
    """
    def __init__(self, f, encoding):
        self.reader = codecs.getreader(encoding)(f)

def __iter__(self):
    return self

def next(self):
    return self.reader.next().encode("utf-8")

class UnicodeReader:
    """
    A CSV reader which will iterate over lines in the CSV file "f",
    which is encoded in the given encoding.
    """

def __init__(self, f, dialect=csv.Excel, encoding="utf-8", **kwds):
    f = UTF8Recoder(f, encoding)
    self.reader = csv.reader(f, dialect=dialect, **kwds)

def next(self):
    row = self.reader.next()
    return [unicode(s, "utf-8") for s in row]

def __iter__(self):
    return self

class UnicodeWriter:
    """
    A CSV writer which will write rows to CSV file "f",
    which is encoded in the given encoding.
"""

def __init__(self, f, dialect=csv.Excel, encoding="utf-8", **kwds):
    # Redirect output to a queue
    self.queue = cStringIO.StringIO()
    self.writer = csv.writer(self.queue, dialect=dialect, **kwds)
    self.stream = f
    self.encoder = codecs.getincrementalencoder(encoding)()

def writerow(self, row):
    self.writer.writerow([s.encode("utf-8") for s in row])
    # Fetch UTF-8 output from the queue ...
    data = self.queue.getvalue()
    data = data.decode("utf-8")
    # ... and reencode it into the target encoding
    data = self.encoder.encode(data)
    # write to the target stream
    self.stream.write(data)
    # empty queue
    self.queue.truncate(0)

def writerows(self, rows):
    for row in rows:
        self.writerow(row)
1
kommradHomer

この解決策はクレイジーに聞こえますが、蜂蜜のように滑らかに動作します

import csv

with open('filename', 'wb') as myfile:
    wr = csv.writer(myfile, quoting=csv.QUOTE_ALL,delimiter='\n')
    wr.writerow(mylist)

ファイルはcsvwriterによって書き込まれているため、csvプロパティ、つまりカンマ区切りで保持されます。区切り文字は、毎回、リスト項目を次の行に移動することによって、主要部分で役立ちます。

1