どのように疑問に思います
<input type="text" x-webkit-speech speech />
Chromeに組み込まれている音声認識エンジンはありますか、それともオペレーティングシステムの基盤となる音声認識機能にアクセスしていますか?
うん、ChromeはGoogleのサーバーを介して音声認識を行います。しかし、他のブラウザがそれを別の方法で実装することを選択できなかった理由はありません(たとえば、OSの音声認識機能を使用)。
バル、あなたのリンクは実際には少し古くなっています。最新のGoogleの提案はここにあります: http://www.w3.org/2005/Incubator/htmlspeech/2010/10/google-api-draft.html
音声認識はChrome devチャネルでしばらくの間利用可能でしたが、まだ出荷されておらず、いつ出荷されるかはまだわかりません。APIを試してフィードバックを提供してもらいたいのですが、まだプライムタイムの準備が整っていないと思います。
コードによると、オーディオデータをPOSTリクエストとして次の宛先に送信します:
https://www.google.com/speech-api/v1/recognize?client=chromium&lang=??&lm=??&xhw=??&maxresults=3
lm
はコードではgrammar
であり、xhw
はhardware_info
コメントによるとオプションです。音声はspeex、x-speex-with-header-byteのようです。
// Encode the frame and place the size of the frame as the first byte. This
// is the packet format for MIME type x-speex-with-header-byte.
自分のアプリで使用するようにchromeコードを変更するのは、かなり簡単なようです。
更新:
また、 音声認識APIキー を取得する必要があり、それらは1日あたり50リクエストに制限されています。その制限を増やす方法はありません-支払っても。
彼らは音声認識に独自のAPIを使用しています。例:そこのサーバーにPOSTリクエストを送信します。
これは興味深いかもしれません https://github.com/taf2/speech2text Ruby Google Speech to TextAPIのバインディング
音声認識はGoogleによる提案です。 https://docs.google.com/View?id=dcfg79pz_5dhnp23f5
この機能はChrome 8+に付属しており、実際の認識を実行するためにデータをGoogleサーバーに送信するようです。
はい、ChromeにはWebKitを介した音声サポートが組み込まれています。Googleホームページ(検索ボックスの右側にマイクがあります)を見てください。ただし、 ChromeチームはOmnibox音声サポートに取り組んでいます。結局のところ、ChromeはWebKitベースのブラウザです!
http://www.w3.org/TR/xhtml+voice/ を作成したワーキンググループもありますが、これはOpera以外のブラウザには実装されていないと思います。
Chrome Cr-48でこれを確認しました、動作します。