最近、GoogleはGoogleアシスタントの新しい "Read it" 関数をリリースしました。
Pythonでどうやって試すことができますか? console でGoogle Assistant APIを有効にし、サービスアカウントの認証情報を作成しました。 documentation は、Python実装を提供していません。
簡単な「Hello world」の例を実行したいと思います。テキストを送信してwavファイルを取得します。
Googleでは「アシスタント」という用語をやや大まかに使用しており、1つのプラットフォームのアシスタントで利用できる機能が、他の人でも利用できない場合があります。
長い形式のオーディオを読むことは、すべてのオーディオアシスタントプラットフォームで利用できるのは理にかなっているように見えるかもしれませんが、そうではありません。少なくともこれを書いている時点では、Androidプラットフォームのアシスタントでのみ利用できるようです。これは、その実装の機能であり、完全なアシスタント機能ではないことを示唆しています。
また、Assistant SDKは、趣味での使用のみを目的として正式にリストされていることにも注意してください。アシスタントを備えたプロダクションハードウェアは、ストリーミングオーディオを含む他の機能を処理する別の開発プラットフォームを使用しているようです。
面白い質問ですね!
完全にお手伝いできるかどうかはわかりませんが、 このGoogleアシスタントサービスのドキュメント を見つけました。
ドキュメントによると、「Googleアシスタントサービスでは、アシスタントとの統合を完全に制御できますストリーミングエンドポイントを提供することにより。ユーザーオーディオクエリをこのエンドポイントにストリーミングする- Googleアシスタントの音声応答を受け取ります。 "
理解内容:python言語を使用してGoogleアシスタントAPIを呼び出す言語を使用してgRPC呼び出しでAPIにバインドできます。ドキュメントでは、統合について段階的に説明しています。
これがお役に立てば幸いです。