web-dev-qa-db-ja.com

Scikit Learn:ロジスティック回帰モデルの係数:明確化

予測確率を自分で生成できるように、ロジスティック回帰係数を返す方法を知る必要があります。

私のコードは次のようになります。

lr = LogisticRegression()
lr.fit(training_data, binary_labels)

# Generate probabities automatically
predicted_probs = lr.predict_proba(binary_labels)

Lr.coeff_値は典型的なロジスティック回帰に従うと想定していたため、次のような予測確率を返すことができました。

sigmoid( dot([val1, val2, offset], lr.coef_.T) )

しかし、これは適切な定式化ではありません。 Scikit Learn LogisticRegressionから予測確率を生成するための適切なフォーマットはありますか?ありがとう!

21
zbinsd

ドキュメントをご覧ください( http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html )、オフセット係数はlr.coef_によって保存されません

coef_配列、形状= [n_classes-1、n_features]決定関数の特徴の係数。 coef_はraw_coef_から派生した読み取り専用プロパティで、liblinearの内部メモリレイアウトに従います。 intercept_ array、shape = [n_classes-1]決定関数に追加されたインターセプト(別名バイアス)。パラメータインターセプトがTrueに設定されている場合にのみ使用できます。

試してください:

sigmoid( dot([val1, val2], lr.coef_) + lr.intercept_ ) 
18
prgao