「次へ」や「前へ」などの簡単な音声コマンドを使用してjQueryスライドショーを作成してみたい。 Googleの音声認識を使用する方法はありますか? Chromeのx-webkit-speechについては知っていますが、使用するにはボタンをクリックする必要があります。
MITのWAMIを試してみましたが、Googleの音声認識よりも遅く、精度が低いことがわかりました。
現在、Chromeの場合: http://chrome.blogspot.co.uk/2013/01/hello-browser.html
( api doc )
JavaScriptでこれを簡単に行う方法については、 annyang を確認してください。これは、音声認識の処理を非常に簡単にするライブラリです。
問題は、ユーザーの音声をキャプチャし、処理のために音声サーバーを送信することです。 x-webkit-speechはブラウザに組み込まれており、ブラウザはPCのサウンドカードを使用して音声をキャプチャします。ブラウザだけのJavascript/Jqueryは、ハードウェアデバイスにアクセスできません。 ChromeがDOMのx-webkit-speechオブジェクトを公開しているかどうかわからないので、Javascriptを介してキャプチャできます。
そうは言っても、人々はGoogle Speech APIをリバースエンジニアリングし、コードから使用しました。例については http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/ をご覧ください。
私はこれを見つけました、私は個人的にそれを使用していません、それがあなたが探しているもの全体であるかどうかわかりませんが、見てください。
http://captico.com/introducing-speech-2-text-api-by-google/2011/