Webサイトから再帰的にダウンロードする

Question

ウェブサイトのURLから画像を取得しようとしています "www.example.com/products "この製品フォルダにはたくさんのサブフォルダがあり、製品フォルダをダウンロードする必要があります。

Www.example.com/products、www.example.com/products/subfoldersでは、画像は次のとおりです。

データ付きのサブフォルダーを含むproductsフォルダーをダウンロードするにはどうすればよいですか。

Rahul · Accepted Answer

wget -nd -r -l1 -P /save/location -A jpeg,jpg http://www.example.com/products

説明：

-ndは、ディレクトリ階層の作成を防ぎます（つまり、ディレクトリなし）。

-r再帰的取得を有効にします。詳細については、再帰的ダウンロードを参照してください。

-l1再帰の最大深度レベルを指定します。このディレクトリの場合は1で、productsです。

-Pは、すべてのファイルとディレクトリが保存されるディレクトリプレフィックスを設定します。

-A特定のファイルタイプのみを取得するためのホワイトリストを設定します。文字列とパターンが受け入れられ、両方ともコンマ区切りのリストで使用できます（上記を参照）。詳細については、ファイルの種類を参照してください。

phg · Answer

httrack(1)を試してください。これは、Webサイト全体のローカルミラーを作成するのに最も役立つWebスパイダーです。

リンクされたマンページの例から始めることができます。

DANTILO HS · Answer

wget -nH --page-requisites -R -nH -P mirrorDirectory https://example.com

ここで、mirrorDirectoryは、出力を保存する場所のパスです。