DeConvNetsでのプール解除とデコンボリューションの仕組みを理解しようとしています。
プーリング解除
アンプールの段階で、アクティベーションは最大のアクティベーション選択の場所に復元されますが、これは理にかなっていますが、残りのアクティベーションはどうですか?これらの残りのアクティベーションも復元する必要があるか、何らかの方法で補間する必要があるか、プールされていないマップでゼロとして埋める必要があるか。
デコンボリューション
たたみ込みセクション(つまり、たたみ込み層、Relu、プーリング)の後には、複数のフィーチャマップ出力があり、これは連続する層への入力チャネルとして扱われます(Deconv ..)。元の入力と同じ解像度でアクティベーションマップを実現するために、これらの機能マップをどのように組み合わせることができますか?
Etoropovが書いたように、ZeilerとFergusonによる 可視化と畳み込みネットワークの理解 でプール解除について読むことができます。
アンプーリング:convnetでは、最大プーリング操作は反転不可能ですが、スイッチ変数のセットの各プーリング領域内の最大値の位置を記録することにより、おおよその逆数を取得できます。 deconvnetでは、アンプール操作でこれらのスイッチを使用して、上の層からの再構成を適切な場所に配置し、刺激の構造を保持します。手順の図については、図1(bottom)を参照してください。
デコンボリューションは次のように機能します。
たとえば、次の図では、元の青い画像にゼロ(白)が埋め込まれ、灰色の畳み込みフィルターが適用されて緑の出力が得られます。
出典: デコンボリューションレイヤーとは