私はAI専攻のコンピューティングの学生です。私は現在、最終年度のプロジェクトのトピックを研究しており、ニューラルネットワークについてはほとんど知識がありませんが、非常に興味があります。
私が今考えているトピックは言語と音楽なので、言語と音楽のためにニューラルネットワークで何ができるのか、何が面白いか人気のある範囲になるかについての提案を探しています。別の分野についてもお気軽にご提案ください。
入力、提案、リンク、アドバイス、またはポインタをいただければ幸いです。ありがとう! :)
更新:それで、私がしている可能性が最も高いトピックを絞り込みました:
私の質問は、両方とも学部生が行うにはあまりにも進んでいるかどうかです。
http://archive.ics.uci.edu/ml/datasets.html を見て、気に入ったトピックが見つかるかどうかを確認してください。
C++およびCの経験がある場合は、Matlabの学習に多くの問題はありません。
使用するトピックについては、上記のリンクを参照して、NNに適用できるものを見つけて、acm、ieee、またはその他のリポジトリでNNに関する論文を検索し、研究やレポートも見つけることができるかどうかを確認することをお勧めします。あなたが探しているかもしれないトピックについて。
幸運を。
ニューラルネットワークについては本当に良いGoogleTechTalkがあります。
youtube.com/watch?v=AyzOUbkUf3M
プロジェクトの頂点に立つためにニューラルネットワークを使用することを真剣に考えているなら、それは1時間の価値があります。
テキスト対音楽に関して。ニューラルネットワークは優れた分類器です。それらは、真/偽、オン/オフの分類を持つ静的データで教えるのはかなり簡単です。ネットワークが入力をセットに分類する必要がある場合は、もう少し困難です。
ニューラルネットワークは、データのストリーミングで最も問題があります。これを機能させるためのよく知られたテクニックがいくつかありますが、どれがうまく機能するかについてのあなたの直感は十分ではありません。あなたは他の科学者が何をしたかを見て、彼らの技術を複製する必要があります。そうしないと、NNが学習するのに適していない問題空間を作成するという大きなリスクが発生します。
ニューラルネットワークを介して音楽の波形をストリーミングすると、興味深い結果が得られるとは思いません。データを使用可能な形式に前処理する必要があります。
最後に必要なのは、大量のデータです。多いほど良い。焼き付けられたデータとその分類が必要です。数十万人。一部を手動で分類して学習データセットを作成することはできません。
したがって、このすべてのテキスト分類を考慮すると、音楽よりもはるかに実行可能です。
ニューラルネットワークには、膨大な量のデータが必要です。ウィキペディアは巨大で、各ページに関する多くのメタ情報(人気、品質、編集回数など)があります。 Googleは、「幸せな犬」と「悲しい犬」、またはGoogleのランクが分類である「犬」など、特定の分類を持つ大量のデータセットを取得することもできます。
私の経験では、音楽ジャンルの分類は学部のプロジェクトには難しすぎるでしょう。問題は、ニューラルネット分類器を適用する「楽しいこと」に取り掛かる前に、ネットの意味のある特徴ベクトルを生成するために、あらゆる種類の信号処理の基礎を行う必要があることです。 1分あたりの拍数を考慮してください。特定の種類の音楽には信頼できますが、すべてではありません。それでも先に進みたい場合は、libxtractのようなものを基本ツールとして使用することを検討してください。
申し訳ありませんが、単純化しすぎてしまいますが、霧を少し分散させたいと思います。単純なニューラルネットワークは、関数を(通常)R ^ n(次元nの実数ベクトル空間)からR ^ mなどに近似する方法です。 m = 1と仮定します。サンプルのセット(p、f(p))に基づいて関数を近似する多項式P(x_1、..、x_n)を探す代わりに、s(a_1 * s((a_1 * s() b_11 * x_1 + b_n1 * x_n)+ ... + a_t * s(b_1t * x_1 + b_nt * x_n))ここで、sは、たとえば「シグモイド」関数であるため、この奇妙な関数はサンプルとよく一致します。
動機はおそらく生物学的です。 「トレーニングアルゴリズム」は、上記のa_i、b_ijの値を連続的に調整して、サンプルポイントpでの結果の関数の値が、最急降下法の変形を介して「平均して」f(p)に近づくようにします。主張されており、場合によっては良好な動作をします。 NNは90年代に多くの誇大宣伝に囲まれていましたが、そのサンプルに基づいて未知の関数を近似することであったその本当の目的を考慮しました(「人間の脳を模倣する」などの誇大宣伝された目的とは対照的) 、同じスコープに対して他の多くの近似スキームが提案されました。たとえば、SVM(「サポートベクターマシン」)は、より魅力的な正当化を持っています(「正しいカーネル」を探すという黒い魔法を見た後、誤解を招くこともよくあります。研究記事の仕事)。
ただし、重要なのは、仕事に適した「機能」を選択する限り(つまり、音楽サンプルを100次元、たとえばベクトル空間のポイントに変換する良い方法を見つける)、ジャンルXのポイントがジャンルXの他のポイントに「近く」にあり、ジャンルYのポイントはジャンルYのポイントに「近く」にあり、ジャンルXのポイントはジャンルYのポイントから遠く離れているので、NNを使用できます。 SVM、決定ツリー、またはジャンルを分離するために必要なその他のもの(ただし、精度と効率は異なる場合があります)。重要なのは、適切な機能のセットを見つけることです。少なくとも、この意味でAIを理解している場合(ただし、これが唯一の意味である場合、IBM Watsonは不可能だと思います。)
http://www.heatonresearch.com/encog ここで、ニューラルネットワークに関連するAIアルゴリズムについてすべて学びました。このAPIは、何が起こっているのかを理解するために必要なものを学ぶための非常に良い方法です。それ以来、Boidの選択をシミュレートするときに頻繁に使用するAPIを自分で作成しました。本当に必要ではありませんが、機能します。