このようなUbuntu用のWebスパイダーを探しています Webripper-Calluna Software 。次のようにしてサイト全体をダウンロードできます
wget -r -m example.com
しかし、私が探している機能は、「Linux」などの検索語を入力すると、Webを検索してダウンロードできることです。 Ubuntuにこのようなプログラムはありますか?
Googleアラートを使用してフィードに配信される一種の検索ページを作成し、RSSリーダーまたはThunderbirdを使用してそれらを読むことができます。
RSSにはThunderbirdを使用しています。フィードを単純なhtmlにエクスポートできるRSSリーダーがあるかどうかはわかりません。
Httrack(CLI)またはwebhttrack(Webインターフェース)を試してみてください、それはユニバースリポジトリにあります。あなたが説明する検索用語の機能についてはわかりませんが、簡単に設定できるオプションがたくさんあります。
http ripper を試すことができます。
ウェブサイトに投稿された機能は次のとおりです。
Free Software (GPL 3) Generic (works with almost every website) Runs on GNU/Linux and Windows Nearly undetectable / blockable by servers Built with python and pygtk
スクリーンショット
Httpripperの開発者自身によるチュートリアルをご覧ください。
ダウンロードリンク:
Ubuntu 11.10 x64の下で私のために働いた