16ビット/ 8000HZ/Mono/PCM.wavファイルがいくつかあります。電話システムで使用するには8ビットに変換する必要があります。
しかし、変換後、ソースサウンド全体が無音であっても、8ビットの.wavファイルに多くのノイズが表示されることがわかりました。 ( Audacity を使用して無音を生成し、16ビットのMicrosoft WAVにエクスポートしてから、8ビットのMicrosoft WAV(その他の非圧縮ファイル)にエクスポートして、何が起こったかを聞くことができます)。
私はそのような変換を行うために Audacity 、 sox 、 CoolEdit ( trial )を試みました、それらはすべて後にノイズを生成します変換。
これはどのように起こったのですか?そして、これを回避する方法はありますか?
あなたが参照しているノイズは ディザ である可能性があります。多くのビットレート変換アルゴリズムは、変換前に信号に低振幅で、多くの場合周波数形状のノイズであるディザを追加します。このノイズは、ほとんどの場合、実際に変換の可聴品質を向上させます。ディザリングが必要ない場合は、アプリケーションの設定でディザリングを無効にできることを願っています。
8ビットの音が聞こえないと、話しているノイズの種類を判断するのは困難ですが、考えられる問題はいくつかあります。
(1)16ビットから8ビットに変換すると、常に一般的な品質の低下が発生します。結局のところ、情報を破棄することになります。
(2)16ビットサンプルが正規化されていない場合(つまり、16ビット範囲全体のごく一部しか使用していない場合)、8ビットに変換すると品質が非常に低くなります-最初に正規化して、変換後に8ビット範囲全体を使用します。
(3)2つの一般的ですが異なる8ビットオーディオ表現があります。符号付き(2の補数)と符号なし(オフセット)で、後者の方が一般的です。間違った形式を使用した場合、つまり、ある形式に変換した後、別の形式を想定して再生しようとすると、音声は認識できますが、かなり悪い音になります。
(4)テレフォニー(音声)アプリケーションの場合、線形ではなく8ビットオーディオに非線形(対数)エンコーディングを使用するのが一般的です。最も一般的な2つは、 A-law と µ-法 。ただし、変換された8ビットオーディオは線形です。 A-lawまたはµ-lawを期待するテレフォニーアプリケーションでリニアPCMを使用しようとしている場合は、歪んだ混乱のように聞こえます。