私はpandasとpythonが初めてです。私の入力データは
category text
1 hello iam fine. how are you
1 iam good. how are you doing.
inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]
ここでYはパンダシリーズオブジェクトで、numpy配列に変換したいです。だから私は.as_matrixを試しました
YArray= Y.as_matrix(columns=None)
print YArray
しかし、[1,1]として出力されました(列カテゴリが1つと行が2つしかないため、これは間違っています)。結果を2x1行列として欲しい。
これを試して:
。as_matrixを系列オブジェクトに適用した後
Y.reshape((2,1))
.as_matrix()はnumpy-arrayではなくnumpy-arrayのみを返すため、 ここにリンク
Numpy配列を取得するには、必要があります
Y.values
Dfがデータフレームの場合、データフレームの列はシリーズであり、配列に変換するには、
df = pd.DataFrame()
x = df.values
print(x.type)
次のプリント、
<class 'numpy.ndarray'>
配列に正常に変換します。