私の質問は、言語を使用して音楽から人間の声を抽出する方法についてですpython私はこのコードを通過しましたが、バックグラウンドミュージックを抽出します
from pydub import AudioSegment
from pydub.playback import play
# read in audio file and get the two mono tracks
sound_stereo = AudioSegment.from_file(myAudioFile, format="mp3")
sound_monoL = sound_stereo.split_to_mono()[0]
sound_monoR = sound_stereo.split_to_mono()[1]
# Invert phase of the Right audio file
sound_monoR_inv = sound_monoR.invert_phase()
# Merge two L and R_inv files, this cancels out the centers
sound_CentersOut = sound_monoL.overlay(sound_monoR_inv)
# Export merged audio file
fh = sound_CentersOut.export(myAudioFile_CentersOut, format="mp3")
私は歌で人間の声を抽出する必要があります
そうでない場合は、別のオーディオファイルから1つのオーディオファイルを差し引く方法
Librosaライブラリをいつでも使用できます。これは、Pythonでのオーディオ処理にお気に入りのライブラリです。ボーカル(およびその他の散発的な前景信号)を、付随する楽器から分離するのに役立ちます。
https://librosa.github.io/librosa_gallery/auto_examples/plot_vocal_separation.html
それはスライスを取り、同じスライスをプロットしますが、前景と背景に分けられます