Wgetを使用してmp3ファイルを https://musicforprogramming.net/ からダウンロードしようとしています。ご覧のとおり、ホームページから各トラックページへのリンク(例: https://musicforprogramming.net/?twentythree )、および各トラックページのmp3ファイルへのリンク(例:例 https://datashat.net/music_for_programming_23-panda_magic.mp )。
このコマンドですべてのmp3ファイルがダウンロードされると思いました。
wget -r --no-parent --accept mp3,MP3 -nd https://musicforprogramming.net/
しかし、それはそれらを無視しているようで、ダウンロードせずにhtmlページをスキャンするだけです。
そこにリンクされている〜50のmp3ファイルをすべてwgetにダウンロードさせるにはどうすればよいですか?
デフォルトでは、wgetは現在のドメインのみに固執すると思います。したがって、ファイルがmusicforprogramming.netでホストされている場合は、ダウンロードされます。
-Dを使用して、受け入れられたドメインのリストを渡します。
( Hugh Grigg のコメントで指摘されているように、--span-hosts
も必要です。
wget -r --no-parent --accept mp3,MP3 -nd -D datashat.net,musicforprogramming.net --span-hosts https://musicforprogramming.net/