運が悪かったので、Amazon AWSTranscribeサービスからのjson応答を変換するパッケージを見つけようとしています。
FiddleのJavaScript部分のJSON
の例 を見ることができます。
素朴なアプローチを取りたくはありません。10語のように「束ねる」だけで、キャプションが奇妙な形で配置されます。
GoogleSpeechサービスまたはSpeechmaticsを使用してプログラムでそれを行う方法も受け入れます。それらはすべて、Wordごとに分類されたjsonファイルを返します。
誰かが以前にそれを使ったことがありますか?
ありがとう!
あなたはおそらくそれを行う方法を見つけたか、スクリプトを作成したでしょう。また、既製のソリューションを見つけようとしたため、AmazonTranscribeのJSON出力からSRTを生成するJavaScriptコードを作成することになりました。
https://www.yash.info/aws-srt-creator.htm
私は生理(。)で文を壊しています。これはスタンドアロンのHTMLファイルです。必要に応じて、ダウンロードして変更してください。
私はこのpython githubのスクリプトを使用しましたが、docx形式に非常にうまくフォーマットされています。出力には、単語の信頼レベルの散布図や、信頼度の低い単語への色の変更も含まれています。
https://github.com/kibaffo33/aws_transcribe_to_docx
これは私にとっては本当にうまくいきましたが、pythonスクリプトを変更したい場合は、これをhtmlに簡単に移動させることができると思います。
これがあなたが使えるかもしれない要点です。または、何が必要かを考えてください。基本的に私がやったこと。 https://Gist.github.com/mwleinad/67a39d7d723f0a2ed076ed2485e098ae
最終的に、AWS TranscribeJSONファイルをSRTに変換するBashスクリプトを作成しました。
'jq'を使用してJSONファイルを解析します。
これは、Amazon Transcribe.jsonトランスクリプトをより読みやすいトランスクリプトに変換するために私が見つけた簡単なユーティリティスクリプトです。
ここに何かがあります(aws-transcribe-to-vtt
) しかし、私はまだそれをテストすることができませんでした...
私はこの答えに出くわし、他のリンクのいくつかに表示されている情報のいくつかを使用して、しばらくの間それを探していました-私が使用できるものに近づきましたが、正確な答えには到達しませんでした、私はソリューションを完了することにしました。
ステップ1-テキストブロックとスピーカー名を処理するためのHTMLテンプレートを取得し、押してjavascriptを処理するためのボタンステップ2-Awsから受信したjsonをテキストブロックに貼り付けますステップ3-ボタンをクリックします。
HTMLページはここにあります: https://js.do/lnortje_gmail-com/Amazon-transcribe-to-html-converter
私が役に立ったことの1つは、翻訳の信頼性を知ることです。これを使用すると、翻訳のどこに問題が発生する可能性があるかを知ることができ、作品が翻訳された正確な時刻を表示して、録音。
まあ、それを使って楽しんでください、いつか誰かを助けるかもしれません:)