このエラーが発生しますInvalidArgument: 400
google Speech-to-textで問題が発生しているようです。2チャネルオーディオ(ステレオ)を使用していて、APIが(モノラル)でwavを待機しています。
オーディオエディターでファイルを変換すると機能する場合がありますが、オーディオエディターを使用してファイルのバッチを変換することはできません。 PythonまたはGoogle Cloudのいずれかでオーディオタイプを変更する方法はありますか?.
注:すでに「waveモジュール」で試しましたが、認識されないファイルタイプのエラー#7が発生し続けました(Pythonからモジュールwaveでwavファイルを読み取ることができませんでした)
-ERROR- InvalidArgument:400シングルチャネル(モノ)オーディオを使用する必要がありますが、WAVヘッダーは2チャネルを示しています。
以下の関数を使用して、オーディオシャネルとframe_rateを動的に返す必要があります。これは、オーディオファイルパスを取得し、フレームレートとシャネルの数を返します。
def frame_rate_channel(audio_file_name): print(audio_file_name) with wave.open(audio_file_name, "rb") as wave_file: frame_rate = wave_file.getframerate() channels = wave_file.getnchannels() return frame_rate,channels