私が持っています 部分的に畳み込みニューラルネットワーク(LeNet) を読んだ後、最大プーリングを理解しました:
CNNのもう1つの重要な概念は、max-poolingです。これは、非線形ダウンサンプリングの一種です。最大プーリングは、入力画像を重複しない長方形のセットに分割し、そのようなサブ領域ごとに最大値を出力します。
サムプーリングはどうですか?わかりやすい記事が見つかりませんでした。
たたみ込みニューラルネットワークは、高次元のデータの処理に優れています。カーネルの重みのみに重みの数を制限すると、画像または音声の不変性特性により学習が容易になります。しかし、何が起こっているのかを注意深く見ると、最初のたたみ込み層の後、プーリングなどのトリックを行わないと、データの次元が大幅に増加する場合があります。
Max poolingは、畳み込み層の固定領域から最大入力のみを取得するだけで、データの次元を減らします。 Sum poolingは同様に機能します-最大値ではなく入力の合計を取ることにより。
これらのアプローチの概念的な違いは、キャッチできる不変性の種類にあります。 Max poolingは、プールされた領域内のパターンの存在に敏感です。 Sum pooling(Mean poolingに比例)は、指定された領域内のパターンの存在の平均値を測定します。
UPDATE:
Sum pooling/Mean poolingのサブリージョンは、Max poolingとまったく同じに設定されますが、max関数sum/meanを使用します。プーリングに関する段落の here について読むことができます。