ValueError：不明なラベルタイプ：「不明」

Question

次のコードを実行しようとしました。ところで、私はpythonとsklearnの両方が初めてです。

import pandas as pd import numpy as np from sklearn.linear_model import LogisticRegression # data import and preparation trainData = pd.read_csv('train.csv') train = trainData.values testData = pd.read_csv('test.csv') test = testData.values X = np.c_[train[:, 0], train[:, 2], train[:, 6:7], train[:, 9]] X = np.nan_to_num(X) y = train[:, 1] Xtest = np.c_[test[:, 0:1], test[:, 5:6], test[:, 8]] Xtest = np.nan_to_num(Xtest) # model lr = LogisticRegression() lr.fit(X, y)

ここで、yは0と1のnp.ndarrayです

次のものを受け取ります。

ファイル「C：\ Anaconda3\lib\site-packages\sklearn\linear_model\logistic.py」、行> 1174、適合check_classification_targets（y）

ファイル "C：\ Anaconda3\lib\site-packages\sklearn\utils\multiclass.py"、172行目、check_classification_targetsでValueValue（ "不明なラベルタイプ：％r"％y_type）を発生

ValueError：不明なラベルタイプ：「不明」

sklearnドキュメントから： http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html#sklearn.linear_model.LogisticRegression.fit

y：配列状、形状（n_samples、）ターゲット値（分類のクラスラベル、回帰の実数）

私のエラーは何ですか？

upd：

yはarray（[0.0、1.0、1.0、...、0.0、1.0、0.0]、dtype = object）サイズは（891、）

Miriam Farber · Accepted Answer

yはobjectタイプであるため、sklearnはそのタイプを認識できません。 y = train[:, 1]行の直後にy=y.astype('int')行を追加します。