web-dev-qa-db-ja.com

画像のロゴ認識

画像のロゴ認識で行われた最近の学術研究を知っている人はいますか?この特定のテーマに精通している場合にのみ回答してください(自分で「ロゴ認識」をGoogleで検索できます。ありがとうございました)。コンピュータビジョンの知識があり、オブジェクト認識の作業を行った人は誰でもコメントを歓迎します。

更新:アルゴリズムの側面(実際のデータ、効率性の考慮事項については、アルゴリズムの側面(適切だと思うアプローチ、現場の論文、機能するかどうか(テスト済み))を参照してください側面(使用されているプログラミング言語、またはOpenCVを使用していたかどうか...)画像のインデックス作成とコンテンツベースの画像検索の作業も役立ちます。

57
elijah

ここでSIFTなどのローカル機能を使用してみてください: http://en.wikipedia.org/wiki/Scale-invariant_feature_transform

ロゴの形状は通常一定であるため、機能するはずです。したがって、抽出された機能は適切に一致します。

ワークフローは次のようになります。

  1. コーナーの検出(例:Harrisコーナー検出器)-Nikeロゴの場合、それらは2つの鋭い端です。

  2. 記述子の計算(SIFT-128D整数ベクトルなど)

  3. トレーニング段階でそれらを覚えておいてください。マッチング段階で、トレーニング中に取得したデータベース内のすべてのフィーチャの最近傍を見つけます。最後に、マッチのセットがあります(それらのいくつかはおそらく間違っています)。

  4. RANSACを使用して、間違った一致をシードします。したがって、理想的なロゴ画像からロゴを見つける場所への変換を記述するマトリックスを取得します。設定に応じて、さまざまな種類の変換を許可することができます(単なる変換、変換と回転、アフィン変換)。

Szeliskiの本には、ローカル機能に関する章(4.1)があります。 http://research.Microsoft.com/en-us/um/people/szeliski/Book/

追伸.

  1. 写真の中にロゴを見つけたいと思っていました。たとえば、すべてのペプシの看板を見つけて、それらが歪んでいる可能性があるのです。画面上でテレビチャンネルのロゴを検索する必要がある場合(回転および拡大縮小されないように)、簡単に行うことができます(パターンマッチングなど)。

  2. 従来のSIFTは色情報を考慮しません。ロゴには通常一定の色が付いているため(正確な色は稲妻とカメラに依存しますが)、何らかの方法で色情報を検討する必要があります。

38

実世界の画像でのロゴの検出/認識に取り組みました。また、データセット FlickrLogos-32 を作成し、データ、グラウンドトゥルース、評価スクリプトを含めて公開しました。

私たちの仕事では、ロゴ認識を検索問題として扱い、マルチクラス認識を単純化し、そのようなシステムを多くの(たとえば数千の)ロゴクラスに簡単に拡張できるようにしました。

最近、Bundle min-Hashingと呼ばれるバンドル手法を開発しました。これは、複数のローカルフィーチャの空間構成を非常に特徴的なフィーチャバンドルに集約します。バンドル表現は、検索と認識の両方に使用できます。ロゴの検出については、次のヒートマップの例を参照してください。

enter image description hereenter image description here

内部操作の詳細、アプローチの潜在的な用途、そのパフォーマンスの実験、そしてもちろん関連論文への多くの参照も論文にあります [1][2]

31
Stefan

それに取り組んだ:スポーツビデオデータベースでの商標の一致と取得は、論文のPDFを取得します: http://scholar.google.it/scholar?cluster=9926471658203167449&hl=ja&as_sdt= 20

SIFTを商標および画像記述子として使用し、正規化されたしきい値マッチングを使用してモデルと画像間の距離を計算しました。最新の作業では、同じ商標の異なるバージョンに存在するSIFTポイントの関連性を評価して作成されたメタモデルを使用して、計算を大幅に削減することができました。

一般に、ビデオの操作は、現在使用されているテレビ規格の非常に悪い視覚品質のために、写真の操作よりも難しいと思います。

マルコ

7
Marco

似たようなことをしなければならないプロジェクトに取り組みました。最初は、このソフトウェアを使用してHaar Trainingテクニックを使用してみました

OpenCV

それは機能しましたが、私たちのニーズに最適なソリューションではありませんでした。ソース画像(ロゴを探していた場所)は固定サイズで、ロゴのみが含まれていました。このため、既知の良好な一致でcvMatchShapesを使用し、返された値を比較して良好な一致とみなすことができました。

4
sberry