Ubuntu用のWebスパイダー

Question

このようなUbuntu用のWebスパイダーを探しています Webripper-Calluna Software 。次のようにしてサイト全体をダウンロードできます

wget -r -m example.com

しかし、私が探している機能は、「Linux」などの検索語を入力すると、Webを検索してダウンロードできることです。 Ubuntuにこのようなプログラムはありますか？

To Do · Accepted Answer

Googleアラートを使用してフィードに配信される一種の検索ページを作成し、RSSリーダーまたはThunderbirdを使用してそれらを読むことができます。

RSSにはThunderbirdを使用しています。フィードを単純なhtmlにエクスポートできるRSSリーダーがあるかどうかはわかりません。

bkzland · Answer

Httrack（CLI）またはwebhttrack（Webインターフェース）を試してみてください、それはユニバースリポジトリにあります。あなたが説明する検索用語の機能についてはわかりませんが、簡単に設定できるオプションがたくさんあります。

~~http://packages.ubuntu.com/de/oneiric/webhttrack~~

HTTrack Website Copier-フリーソフトウェアオフラインブラウザ（GNU GPL）

~~http://packages.ubuntu.com/de/oneiric/webhttrack~~

HTTrack Website Copier-フリーソフトウェアオフラインブラウザ（GNU GPL）

blade19899 · Answer

http ripper を試すことができます。

ウェブサイトに投稿された機能は次のとおりです。

Free Software (GPL 3) Generic (works with almost every website) Runs on GNU/Linux and Windows Nearly undetectable / blockable by servers Built with python and pygtk

^{スクリーンショット}

Httpripperの開発者自身によるチュートリアルをご覧ください。

httpripper.ogg 。

ダウンロードリンク：

httpripper_1.1.1_all.deb

Ubuntu 11.10 x64の下で私のために働いた