ビデオファイルから音声とバックグラウンドミュージックを分離する方法

Question

ビデオファイルから音声とバックグラウンドミュージックを分離することはできますか？

バックグラウンドミュージックだけが必要です。

ビデオのタイプ：MP4

Windowsでの作業XP 32ビットSP

afrazier · Accepted Answer

ビデオの個別のオーディオトラックでない限り、簡単にはできません。おそらく、ビデオからオーディオトラックを別のファイルに抽出し、専用ツールでオーディオファイルを編集して、結果をビデオに再多重化する必要があります。

Demux/remuxの部分は簡単です。難しいのは、バックグラウンドミュージックを分離することです。おそらく、さまざまな効果を試してみる必要があります。そのすべてが、オーディオの忠実度を大幅に低下させるか、両方ではないにしても、完全に会話を削除しない可能性があります。さらに、その出力を新しいmp3/aacファイルに再エンコードすることになり、再エンコードとオーディオ処理の間では、出力が元のサウンドよりもはるかに悪く聞こえることになります。

バックグラウンドミュージックを再度マスタリングして、ムービーファイルのオーディオトラックを完全に置き換えると、より良い結果が得られる場合があります。

slhck · Answer

大胆さ

Audacity –無料のオープンソースクロスプラットフォームオーディオエディター– Vocal Reduction and Isolation効果。まず、ビデオファイルからオーディオを抽出する必要があります。 ffmpegを使用：

ffmpeg -i video.mp4 -c:a pcm_s16le audio.wav

そして、audio.wav Audacityへのファイル：

バックグラウンドミュージックのみを取得する場合は、Remove Vocalsオプションを選択します。反対が必要な場合は、Isolate Vocalsを選択します。

これが完璧に聞こえることは決してないことに注意してください。ボーカルの分離は難しい作業です。聞こえるすべてのものが基本的に2つのトラックにミックスされるためです。アルゴリズムは、さまざまな音源を分離する上で、頭脳ほど優れたものにはなりません。オーディオソースは、ボーカルがデッドセンターにパンニングされたステレオファイルである必要があります。また、誤検知が発生し、プロセスの他の機器が削除される可能性があります。

脾臓

Spleeter は、Pythonライブラリで、共同オーディオソースから音楽とボーカルを抽出できます。これは機械学習ベースであり、さまざまな出力タイプ（ステムの数）を提供できます抽出された）。

Bigbio2002 · Answer

使用していたエディターに組み込まれているローパスフィルターを実行することで、ビデオから会話やノイズを取り除くことができました。動画の対象となったロボットの旋風が残った。

私はオーディオの専門家ではありません。これが特定のケースで機能することを保証することはできませんが、試してみる価値はあります。