ビデオファイルから音声とバックグラウンドミュージックを分離することはできますか?
バックグラウンドミュージックだけが必要です。
ビデオのタイプ:MP4
Windowsでの作業XP 32ビットSP
ビデオの個別のオーディオトラックでない限り、簡単にはできません。おそらく、ビデオからオーディオトラックを別のファイルに抽出し、専用ツールでオーディオファイルを編集して、結果をビデオに再多重化する必要があります。
Demux/remuxの部分は簡単です。難しいのは、バックグラウンドミュージックを分離することです。おそらく、さまざまな効果を試してみる必要があります。そのすべてが、オーディオの忠実度を大幅に低下させるか、両方ではないにしても、完全に会話を削除しない可能性があります。さらに、その出力を新しいmp3/aacファイルに再エンコードすることになり、再エンコードとオーディオ処理の間では、出力が元のサウンドよりもはるかに悪く聞こえることになります。
バックグラウンドミュージックを再度マスタリングして、ムービーファイルのオーディオトラックを完全に置き換えると、より良い結果が得られる場合があります。
Audacity –無料のオープンソースクロスプラットフォームオーディオエディター– Vocal Reduction and Isolation効果 。まず、ビデオファイルからオーディオを抽出する必要があります。 ffmpeg
を使用:
ffmpeg -i video.mp4 -c:a pcm_s16le audio.wav
そして、audio.wav
Audacityへのファイル:
バックグラウンドミュージックのみを取得する場合は、Remove Vocalsオプションを選択します。反対が必要な場合は、Isolate Vocalsを選択します。
これが完璧に聞こえることは決してないことに注意してください。ボーカルの分離は難しい作業です。聞こえるすべてのものが基本的に2つのトラックにミックスされるためです。アルゴリズムは、さまざまな音源を分離する上で、頭脳ほど優れたものにはなりません。オーディオソースは、ボーカルがデッドセンターにパンニングされたステレオファイルである必要があります。また、誤検知が発生し、プロセスの他の機器が削除される可能性があります。
Spleeter は、Pythonライブラリで、共同オーディオソースから音楽とボーカルを抽出できます。これは機械学習ベースであり、さまざまな出力タイプ(ステムの数)を提供できます抽出された)。
使用していたエディターに組み込まれているローパスフィルターを実行することで、ビデオから会話やノイズを取り除くことができました。動画の対象となったロボットの旋風が残った。
私はオーディオの専門家ではありません。これが特定のケースで機能することを保証することはできませんが、試してみる価値はあります。