web-dev-qa-db-ja.com

セマンティックセグメンテーションのためのU-netとFCNの背後にある直感

私は次のことをよく理解していません:

提案された Shelhamer et alによるセマンティックセグメンテーションのFCN では、画像内のオブジェクトのマスク/正確な位置を構築するためのピクセル間予測を提案しています。

生物医学画像セグメンテーション用のFCNのわずかに変更されたバージョンである -net では、主な違いは「縮小するパスから対応してトリミングされた特徴マップとの連結」であるようです。

さて、なぜこの機能が特に生物医学的セグメンテーションに違いをもたらすのでしょうか?生物医学画像と他のデータセットについて私が指摘できる主な違いは、生物医学画像には、一般的な日常のオブジェクトほどオブジェクトを定義する豊富な機能セットがないことです。また、データセットのサイズも制限されています。しかし、この追加機能は、これら2つの事実またはその他の理由に触発されていますか?

8
Jonathan

FCNとU-Net:

FCN

  1. 一度だけアップサンプリングします。つまり、デコーダーには1つのレイヤーしかありません
  2. 元の実装 github repo は、双一次補間を使用して、コンボラブされた画像をアップサンプリングします。つまり、ここには学習可能なフィルターはありません
  3. fCNのバリアント-[FCN16sおよびFCN8s]は、下位層からのスキップ接続を追加して、スケールの変更に対して出力を堅牢にします

U-Net

  1. 複数のアップサンプリングレイヤー
  2. 合計する代わりに、スキップ接続と連結を使用します
  3. 固定内挿法の代わりに学習可能な重みフィルターを使用します
12
shasvat desai

U-Netは、J。LongのFCNペーパーに基づいて構築されています。いくつかの違いは、元のFCNペーパーがデコーダーの半分を使用して分類をアップサンプリングしたことです(つまり、ネットの後半全体が深さC-クラスの数)

U-Netは後半を機能空間にあると考え、最後に最終的な分類を行います。

それについては、生物医学IMOに特別なことは何もありません

1
aivision2020