NumPy配列をcsvファイルにダンプする

Question

NumPy配列をCSVファイルにダンプする方法はありますか？私は2D NumPy配列を持っていて、それを人間が読める形式でダンプする必要があります。

Jim Brissom · Accepted Answer

numpy.savetxt は配列をテキストファイルに保存します。

import numpy a = numpy.asarray([ [1,2,3], [4,5,6], [7,8,9] ]) numpy.savetxt("foo.csv", a, delimiter=",")

maxbellec · Answer

pandasを使うことができます。それはいくらかの追加メモリを取るのでそれは常に可能であるというわけではない、しかしそれは非常に速くて使いやすい。

import pandas as pd pd.DataFrame(np_array).to_csv("path/to/file.csv")

ヘッダやインデックスが不要な場合はto_csv("/path/to/file.csv", header=None, index=None)を使用してください。

atomh33ls · Answer

tofile はこれを行うのに便利な関数です。

import numpy as np a = np.asarray([ [1,2,3], [4,5,6], [7,8,9] ]) a.tofile('foo.csv',sep=',',format='%10.5f')

Manページにはいくつかの役に立つメモがあります。

これは配列データを素早く保存するための便利な機能です。エンディアンと精度に関する情報が失われるため、この方法は、データのアーカイブやエンディアンの異なるマシン間でのデータ転送を目的としたファイルには適していません。これらの問題のいくつかは速度とファイルサイズを犠牲にしてテキストファイルとしてデータを出力することによって克服することができます。

注意。この関数は複数行のcsvファイルを生成するのではなく、すべてを1行に保存します。

Mike T · Answer

レコード配列をヘッダー付きのCSVファイルとして作成するには、もう少し作業が必要です。

この例では、最初の行にヘッダーがあるCSVファイルを読み取り、それから同じファイルに書き込みます。

import numpy as np # Write an example CSV file with headers on first line with open('example.csv', 'w') as fp: fp.write('''\ col1,col2,col3 1,100.1,string1 2,222.2,second string ''') # Read it as a Numpy record array ar = np.recfromcsv('example.csv') print(repr(ar)) # rec.array([(1, 100.1, 'string1'), (2, 222.2, 'second string')], # dtype=[('col1', '<i4'), ('col2', '<f8'), ('col3', 'S13')]) # Write as a CSV file with headers on first line with open('out.csv', 'w') as fp: fp.write(','.join(ar.dtype.names) + '
') np.savetxt(fp, ar, '%s', ',')

この例では、カンマ付きの文字列は考慮されていません。非数値データの引用符を検討するには、 csv パッケージを使用します。

import csv with open('out2.csv', 'wb') as fp: writer = csv.writer(fp, quoting=csv.QUOTE_NONNUMERIC) writer.writerow(ar.dtype.names) writer.writerows(ar.tolist())

Rimjhim . · Answer

コラムに書きたい場合：

 for x in np.nditer(a.T, order='C'): file.write(str(x)) file.write("
")

ここで 'a'はnumpy配列の名前、 'file'はファイルに書き込む変数です。

続けて書く場合：

 writer= csv.writer(file, delimiter=',') for x in np.nditer(a.T, order='C'): row.append(str(x)) writer.writerow(row)

Daksh · Answer

すでに説明したように、配列をCSVファイルにダンプする最善の方法は.savetxt(...)methodを使用することです。しかし、それを正しく行うために知っておくべきことがいくつかあります。

たとえば、dtype = np.int32を次のようにして派手な配列があるとします。

 narr = np.array([[1,2], [3,4], [5,6]], dtype=np.int32)

としてsavetxtを使用して保存したい

np.savetxt('values.csv', narr, delimiter=",")

データを浮動小数点指数形式で格納します。

1.000000000000000000e+00,2.000000000000000000e+00 3.000000000000000000e+00,4.000000000000000000e+00 5.000000000000000000e+00,6.000000000000000000e+00

次のようにfmtというパラメータを使用してフォーマットを変更する必要があります。

np.savetxt('values.csv', narr, fmt="%d", delimiter=",")

元の形式でデータを保存する

圧縮gz形式でデータを保存する

また、savetxtは.gz圧縮フォーマットでデータを格納するために使用することができ、これはネットワーク上でデータを転送する間に便利かもしれません。

.gzとしてファイルの拡張子を変更するだけで、numpyがすべての処理を自動的に行います。

np.savetxt('values.gz', narr, fmt="%d", delimiter=",")

それが役に立てば幸い

Mr Poin · Answer

あなたのテンキーな配列（例えばyour_array = np.array([[1,2],[3,4]])）を1つのセルに保存したい場合は、まずそれをyour_array.tolist()で変換することができます。

それから1つのセルへの通常の方法でそれを保存しなさい、delimiter=';'で、そしてcsv-ファイルのセルはこの[[1, 2], [2, 4]]のように見えるでしょう

それからあなたはこのようにあなたの配列を復元することができます：your_array = np.array(ast.literal_eval(cell_string))

Greg · Answer

モジュールを使わずに純粋なpythonでそれを行うこともできます。

# format as a block of csv text to do whatever you want csv_rows = ["{},{}".format(i, j) for i, j in array] csv_text = "
".join(csv_rows) # write it to a file with open('file.csv', 'w') as f: f.write(csv_text)

DrDEE · Answer

私はあなたがまた次のように非常に簡単にこれを達成することができると信じています：

Numpy配列をPandasデータフレームに変換
CSVとして保存

例えば＃1：

 # Libraries to import import pandas as pd import nump as np #N x N numpy array (dimensions dont matter) corr_mat #your numpy array my_df = pd.DataFrame(corr_mat) #converting it to a pandas dataframe

例えば＃2：

 #save as csv my_df.to_csv('foo.csv', index=False) # "foo" is the name you want to give # to csv file. Make sure to add ".csv" # after whatever name like in the code

Tamil Selvan S · Answer

Pythonでは、csv.writer（）モジュールを使用してcsvファイルにデータを書き込みます。このモジュールはcsv.reader（）モジュールに似ています。

import csv person = [['SN', 'Person', 'DOB'], ['1', 'John', '18/1/1997'], ['2', 'Marie','19/2/1998'], ['3', 'Simon','20/3/1999'], ['4', 'Erik', '21/4/2000'], ['5', 'Ana', '22/5/2001']] csv.register_dialect('myDialect', delimiter = '|', quoting=csv.QUOTE_NONE, skipinitialspace=True) with open('dob.csv', 'w') as f: writer = csv.writer(f, dialect='myDialect') for row in person: writer.writerow(row) f.close()

区切り文字は、フィールドを区切るために使用されるストリングです。デフォルト値はカンマ（、）です。