私は学部生で、このプログラムの最後の年です。他のコンピューティングの学位と同様に、私はコンピューティングの対象となるトピックに関してプロジェクト(個人)を行う必要があります。コンピュータービジョン(正確には、オブジェクトの検出または追跡)の対象となる何かをしたい。このトピックに関する情報を検索していると、この種のプロジェクトを行った人がすでにたくさんいることがわかりました。私の質問は、ビデオ内のオブジェクトを追跡するようなプロジェクトを行う場合、独自のアルゴリズムを考え出す必要があるのか、それともすでに利用可能なアルゴリズムがあるのかということです。 (私はJavaに精通していて、Pythonを少し始めました)
トピックを取り上げる際のガイドと、開始方法または開始場所に関するアイデアを教えてください。
私は大学院でコンピュータービジョンの基本コースを受講しました。最初のプロジェクトの1つは、一連の画像をシームレスな360度のパノラマにつなぎ合わせるシステムを実装することでした。
それは関係しました:
このプロジェクトの課題は、高速な画像スティッチングを可能にするのに十分な効率のコードを作成することです。
あなたはプロジェクトであなたを助けるためにインターネット上でたくさんのリソースを見つけることができます。
本当にクールで面白いことをしたい場合は、ビデオで活動検出アルゴリズムを開発してみてください。たとえば、「車を離れる人」、「建物に入る人」などです。これは簡単な作業ではなく、UG論文としては十分に挑戦的です。 OpenCVなどのツールキットを使用して、アルゴリズムに焦点を合わせながら、ビデオ処理やオブジェクト検出などの基礎を築くことができます。
多くのコンピュータビジョンと画像分析アルゴリズムがすでに存在しています。数年前に大学院で授業を受けたので面白かったので、大学の図書館や書店でこのトピックに関するテキストを探して、何が利用できるかをよく理解することをお勧めします。
このテクノロジーには実際のアプリケーションがあります。光学式文字認識(OCR)は、注目を集めているアプリケーションの1つです。
あなたは面白いトピックを選びました、楽しんでください! :)
pythonおよびopenCVの開始点:
http://creatingwithcode.com/howto/face-detection-in-static-images-with-python
以下は、興味深いと思われるコンピュータビジョンプロジェクトのアイデアの一部です。
ディープラーニングプロジェクトを開始するには、Theano/TensorFlowで実行されるKerasライブラリを多数のバックエンドとして使用することをお勧めします 例 。さらに、OpenCV tutorials が非常に役立つことがわかります。また、上記のいくつかのプロジェクトの実装は、次の github ページにあります。