web-dev-qa-db-ja.com

Linuxでウェブサイトをミラーリングする方法は?

この放棄されたブログの魔女はいつでも消えることができるので、このサイトを閲覧可能なコピーを作成したいと思います。保存されたページには、正しいページ上のリンク、いいねされた画像、およびpdf-sなどの他のファイルが含まれている必要があります。サブドメインのないシンプルなサイトです。

運が悪かったのでwgetバグを試しました。リンクが正しい保存ページを指していないのです。

1
EdgarPE
$ wget -k -p -r http://chubig.net/ ./

私にとっては完全にうまく機能します。 -kリンクを変換します(ダウンロードの最後に実行)、-pはすべての画像、CSSファイルなどを取得し、-r再帰的にダウンロードします(ただし、このドメインにとどまります)。

4
Claudius