特定のページがあるとします。 www.abc.def/ghi/a.html
、www.abc.def./ghi
の下のすべてのページをダウンロードするコマンドオプションはありますか(つまり、www.abc.def/ghi/a.html
、www.abc.def/ghi/b.html
、...)?
httrack
とwebhttrack
をインストールしましたが、正しく使用する方法がわかりません。
httrack
で解決策を見つけましたが、これが最も簡単な方法です。
httrack http://www.abc.def/ghi/ -O <output-folder>
重要なのは、デフォルトでは、httrack
が-Dパラメータを使用することです。
サブディレクトリにのみ移動できます
httrack --help
と入力するとさらに多くのオプションが見つかります。 ここ は便利なリンクです
制限付きでwget
の再帰ダウンロードを試してください。
wget -r --include-directories=ghi --no-parent www.abc.def