wget -A
を使用して、ページから画像をダウンロードしています。
画像がページと同じドメインでホストされている場合、これは正常に機能します。
ただし、他のページからホットリンクされた画像はダウンロードされません(例:imageshack)
Wgetまたは同様のツールを使用して外部イメージもダウンロードするにはどうすればよいですか?
-H
(または--span-hosts
)パラメーターが必要です。異なるホスト/ドメインでホストされているリンクされたリソースのダウンロードを可能にします。
さらに、--exclude-domains
で特定のドメインをブロックできます(例:--exclude-domains=example.com,example.org
)
-D [ドメインリスト]または--domains = [ドメインリスト](カンマ区切り)を使用して、wgetが従うことを許可するドメインを指定する必要があります。
注:ワイルドカードを処理するかどうかはわかりません。
一部のadminsys(私を含む) 一部のファイルでwget user-agent をブロックして、ホットリンク(たとえば)を回避します。
Wgetのような他のツールもあります: cURL 、 httpie など。しかし、ユーザーエージェントによってブロックすることもできます。
したがって、あなたからの問題ではないかもしれませんが、クエリを実行しているドメインからです。