Scikit-learnの「適合」メソッドが何をするのか説明していただけますか?なぜ便利なのですか?
私は機械学習とscikit-learnの初心者です。
一言で言えば:フィッティングはトレーニングと等しい。次に、トレーニング後、モデルを使用して、通常.predict()
メソッド呼び出しで予測を行うことができます。
エラボレートするには:モデルをフィットする(つまり、.fit()
メソッドを使用して)トレーニングデータは、本質的にモデリングプロセスのトレーニングの一部です。使用されているアルゴリズムを介して指定された方程式の係数を見つけます(たとえば、上記の mutto's 線形回帰の例を参照)。
次に、分類子に対して、predict
メソッドを使用して、着信データポイントを(テストセットなどから)分類できます。または、回帰の場合、着信データポイントでpredict
が使用されると、モデルは内挿/外挿されます。
また、スケーラーや他の前処理ステップなどの非機械学習方法に「適合」命名法が使用される場合があることに注意してください。この場合、min-maxスケーラー、TF-IDF、または他の変換の場合のように、指定した関数をデータに単に「適用」しています。
注:ここにいくつかの参照があります...