Google Speech-to-text API、InvalidArgument：400シングルチャネルを使用する必要があります（モノ）

Question

このエラーが発生しますInvalidArgument: 400 google Speech-to-textで問題が発生しているようです。2チャネルオーディオ（ステレオ）を使用していて、APIが（モノラル）でwavを待機しています。

オーディオエディターでファイルを変換すると機能する場合がありますが、オーディオエディターを使用してファイルのバッチを変換することはできません。 PythonまたはGoogle Cloudのいずれかでオーディオタイプを変更する方法はありますか？.

注：すでに「waveモジュール」で試しましたが、認識されないファイルタイプのエラー＃7が発生し続けました（Pythonからモジュールwaveでwavファイルを読み取ることができませんでした）

-ERROR- InvalidArgument：400シングルチャネル（モノ）オーディオを使用する必要がありますが、WAVヘッダーは2チャネルを示しています。

syed irfan · Answer

以下の関数を使用して、オーディオシャネルとframe_rateを動的に返す必要があります。これは、オーディオファイルパスを取得し、フレームレートとシャネルの数を返します。

def frame_rate_channel(audio_file_name): print(audio_file_name) with wave.open(audio_file_name, "rb") as wave_file: frame_rate = wave_file.getframerate() channels = wave_file.getnchannels() return frame_rate,channels