Sklearn.preprocessingモジュールのstandardscalerとnormalizerの違いは何ですか?両方が同じことをしないのですか?つまり、偏差を使用して平均とスケールを削除しますか?
Normalizer ドキュメントから:
少なくとも1つの非ゼロ成分を持つ各サンプル(つまり、データ行列の各行)は、そのノルム(l1またはl2)が1になるように、他のサンプルとは無関係に再スケーリングされます。
そして StandardScaler
平均を削除して単位分散にスケーリングすることにより、機能を標準化する
言い換えると、ノーマライザーは行方向とStandardScaler列方向に作用します。ノーマライザは、偏差による平均とスケールを削除しませんが、行全体を単位ノルムにスケーリングします。
StandardScaler()は、平均を削除して単位分散にスケーリングすることにより、特徴(個人データの特徴(身長、体重など))を標準化します。
(ユニット分散:ユニット分散とは、サンプルサイズが無限大に向かうにつれて、サンプルの標準偏差と分散が1に向かう傾向があることを意味します。)
Normalizer()は、各サンプルを再スケーリングします。たとえば、各会社の株価を互いに独立して再スケーリングします。
一部の株は他の株よりも高価です。これを説明するために、正規化します。ノーマライザーは、各企業の株価を相対的な規模に個別に変換します。
StandardScalerは、平均を削除して単位分散にスケーリングすることで機能を標準化し、Normalizerは各サンプルを再スケーリングします。