web-dev-qa-db-ja.com

pythonを使用してExcelデータを配列に読み込む方法

私が作業しているラボでは、96ウェルプレートリーダーで生成された多くのデータを処理しています。いくつかの計算を実行し、matplotlibを使用して棒グラフを出力するスクリプトを記述しようとしています。

問題は、プレートリーダーがデータを.xlsxファイルに出力することです。 pandasのようないくつかのモジュールがread_Excel関数を持っていることを理解しています。Excelファイルを読み込んでデータフレームに配置する方法を説明できますか?

ありがとう

24ウェルプレートのデータサンプル(簡単にするため):

0.0868  0.0910  0.0912  0.0929  0.1082  0.1350
0.0466  0.0499  0.0367  0.0445  0.0480  0.0615
0.6998  0.8476  0.9605  0.0429  1.1092  0.0644
0.0970  0.0931  0.1090  0.1002  0.1265  0.1455
7
griffinc

このタスクはPandas最近では非常に簡単です。

_import pandas as pd_

df = pd.read_Excel('file_name_here.xlsx', sheet_name='Sheet1')

または

df = pd.read_csv('file_name_here.csv')

これは_pandas.DataFrame_オブジェクトを返します。これは、列、行、df全体、またはiterrowsを持つ個々のアイテムに対して操作を実行するのに非常に強力です。さまざまな方法でスライスすることは言うまでもありません。

4
griffinc

あなたが配列と言うとき、あなたが何を意味しているのか正確にはわかりませんが、あなたがマトリックスに意味するなら、あなたは探しているかもしれません:

import pandas as pd
df = pd.read_Excel([path here])
df.as_matrix()

これはnumpy.ndarrayタイプを返します。

9
Franco Solleza

my wrapper library でも試すことができます。xlrdも使用します。

import pyexcel as pe     # pip install pyexcel
import pyexcel.ext.xls   # pip install pyexcel-xls
your_matrix = pe.get_array(file_name=path_here) # done
1
chfw

すごい xlrd クイックスタートの例のパッケージ here があります。グーグルするだけで、コードスニペットを見つけることができます。私はpandaread_Excel関数を使用したことがありませんが、xlrdは私のすべてのニーズをカバーしており、さらに多くのことを提供できると思います。

1