Python csv文字列から配列

Question

Csvでエンコードされた文字列を解析して配列または辞書に変換する単純なライブラリまたは関数を知っている人はいますか？

私は組み込みの csvモジュールが欲しいとは思わない。なぜなら、私が見たすべての例で、文字列ではなくファイルパスを取るからだ。

Michał Niklas · Accepted Answer

私はStringIOname__を使用します：

try: # for Python 2.x from StringIO import StringIO except ImportError: # for Python 3.x from io import StringIO import csv scsv = """text,with,Polish,non-Latin,letters 1,2,3,4,5,6 a,b,c,d,e,f gęś,zółty,wąż,idzie,wąską,dróżką, """ f = StringIO(scsv) reader = csv.reader(f, delimiter=',') for row in reader: print('	'.join(row))

改行にsplit()を使用した単純なバージョン：

reader = csv.reader(scsv.split('
'), delimiter=',') for row in reader: print('	'.join(row))

または、を区切り文字として使用してこのストリングを行にsplit()してから、各行を値にsplit()するだけでもかまいませんが、この方法では引用符に注意する必要があるため、csvname__モジュールを使用することをお勧めします。

adamk · Answer

シンプル-csvモジュールはリストでも動作します：

>>> a=["1,2,3","4,5,6"] # or a = "1,2,3
4,5,6".split('
') >>> import csv >>> x = csv.reader(a) >>> list(x) [['1', '2', '3'], ['4', '5', '6']]

nvd · Answer

>>> a = "1,2" >>> a '1,2' >>> b = a.split(",") >>> b ['1', '2']

CSVファイルを解析するには：

f = open(file.csv, "r") lines = f.read().split("
") # "
" if needed for line in lines: if line != "": # add other needed checks to skip titles cols = line.split(",") print cols

roskakori · Answer

他の人がすでに指摘しているように、PythonにはCSVファイルを読み書きするモジュールが含まれています。入力文字がASCIIの制限内に収まっている限り、これはかなり機能します。他のエンコードを処理する場合は、さらに作業が必要です。

csvモジュールのPythonドキュメントは、csv.readerの拡張を実装します。これは、同じインターフェイスを使用しますが、他のエンコーディングを処理し、Unicode文字列を返します。ドキュメントからコードをコピーして貼り付けてください。その後、次のようなCSVファイルを処理できます。

with open("some.csv", "rb") as csvFile: for row in UnicodeReader(csvFile, encoding="iso-8859-15"): print row

soulmachine · Answer

csv.reader() https://docs.python.org/2/library/csv.html の公式ドキュメントは非常に役立ちます。

ファイルオブジェクトとリストオブジェクトの両方が適しています

import csv text = """1,2,3 a,b,c d,e,f""" lines = text.splitlines() reader = csv.reader(lines, delimiter=',') for row in reader: print('	'.join(row))

roundar · Answer

ドキュメント：

また、モジュールは文字列の解析を直接サポートしていませんが、簡単に実行できます。

import csv for row in csv.reader(['one,two,three']): print row

文字列を単一の要素リストに変換するだけです。

この例がドキュメントに明示的に含まれている場合、StringIOのインポートは少し過剰に思えます。

ivan_pozdeev · Answer

https://docs.python.org/2/library/csv.html?highlight=csv#csv.reader

csvfileは、イテレータプロトコルをサポートし、next（）メソッドが呼び出されるたびに文字列を返す任意のオブジェクトです。

したがって、StringIO.StringIO()、str.splitlines()、またはジェネレーターさえすべて適切です。

JimS · Answer

これを使用してcsvをリストにロードします

import csv csvfile = open(myfile, 'r') reader = csv.reader(csvfile, delimiter='	') my_list = list(reader) print my_list >>>[['1st_line', '0'], ['2nd_line', '0']]

chfw · Answer

代替ソリューションは次のとおりです。

>>> import pyexcel as pe >>> text="""1,2,3 ... a,b,c ... d,e,f""" >>> s = pe.load_from_memory('csv', text) >>> s Sheet Name: csv +---+---+---+ | 1 | 2 | 3 | +---+---+---+ | a | b | c | +---+---+---+ | d | e | f | +---+---+---+ >>> s.to_array() [[u'1', u'2', u'3'], [u'a', u'b', u'c'], [u'd', u'e', u'f']]

ドキュメント

webbyfox · Answer

Pandaは、PythonでCSVを読み取る非常に強力でスマートなライブラリです。

ここの簡単な例では、example.Zipファイルに4つのファイルが含まれています。

EXAMPLE.Zip -- example1.csv -- example1.txt -- example2.csv -- example2.txt

from zipfile import ZipFile import pandas as pd filepath = 'EXAMPLE.Zip' file_prefix = filepath[:-4].lower() zipfile = ZipFile(filepath) target_file = ''.join([file_prefix, '/', file_prefix, 1 , '.csv']) df = pd.read_csv(zipfile.open(target_file)) print(df.head()) # print first five row of csv print(df[COL_NAME]) # fetch the col_name data

データを取得したら、リストまたはその他の形式で操作することができます。