web-dev-qa-db-ja.com

機械学習の特定の機能により重点を置く方法は?

Scikit-learnなどのライブラリを使用している場合、SVMなどの分類子への入力の特定の機能により多くの重みを割り当てるにはどうすればよいですか?これは人々がすることですか、それとも私の問題に対する別の解決策がありますか?

14
28r

まず第一に-あなたはおそらくそれをすべきではない。機械学習の全体的な概念は、統計分析を使用することです最適な重みを割り当てるため。ここでコンセプト全体を妨害しているので、モデル化しようとしているプロセスにこれが非常に重要であることを示す強力な証拠が必要です。

言われていること-一般的な答えはありません。これは純粋にモデル固有のものであり、その一部はフィーチャに重みを付けることを可能にします-ランダムフォレストでは、関心のあるフィーチャに向かって分析するフィーチャをサンプリングする分布からバイアスをかけることができます。 SVMでは、与えられた機能に定数を掛けるだけで十分です-SVMで機能を正規化するように言われたときのことを覚えていますか?これが理由です-機能のスケールを使用して、特定の機能に向けて分類子を「操縦」できます。値が高いものを優先します。これは実際には、任意の重みノルム正規化モデル(正規化ロジスティック回帰、リッジ回帰、投げ縄など)で機能します。

14
lejlot