web-dev-qa-db-ja.com

Tensorflow Object Detection APIを使用して、画像内の小さなオブジェクトを検出します

Tensorflow Object Detection API を使用して、一連のWebカメラ画像内のオブジェクトを識別したいと思います。 より高速なRCNNモデル COCOデータセットで事前トレーニングされているものは、必要なすべてのオブジェクトカテゴリが含まれているため、適切であるように見えます。

ただし、各画像内のかなり小さなオブジェクトを識別する際のモデルのパフォーマンスを向上させたいと思います。正しく理解している場合は、 構成ファイル のアンカーscalesパラメーターを編集して、モデルがより小さな境界ボックスを使用できるようにする必要があります。

私の質問は次のとおりです。

  • このパラメーターを調整した後、COCOデータセット全体でモデルを再トレーニングする必要がありますか?または、推論のためだけにモデルを変更し、再トレーニングを回避する方法はありますか?
  • 画像をセクションにトリミングし、それぞれを個別に推論する以外に、小さなオブジェクトを正常に識別するためのヒント/コツは他にありますか?

背景情報

現在、1280x720の画像をモデルにフィードしています。約200x150ピクセルでは、オブジェクトを検出するのが難しいと感じています。

12
tobycoleman
  1. 重量はアンカーの形状に依存するため、残念ながら完全に再トレーニングする必要があります。

  2. より高い解像度の特徴マップがあると役立つはずです(ただし、プロセスは遅くなります)。そのため、特徴抽出を変更して、入力サイズの縮小が少ないものを取得するか(通常、ストライドが1を超える最大プーリングがスペースサイズを縮小します)、画像を拡大します。初期画像リサイザーのビット。

5
gdelab