安全なWebサイトからのファイルの定期的なダウンロードなど、いくつかのWeb対話を自動化したいと考えています。これには基本的に、ユーザー名/パスワードの入力と適切なURLへの移動が含まれます。
この特定のWebサイトがログインに不快なJavaScriptとFlashベースのメカニズムを使用していて、メソッドが役に立たないことを発見するためだけに、Pythonで簡単なスクリプトを作成してから、より洗練されたスクリプトを試しました。
次にHTMLUnitを試しましたが、それも機能したくないようです。フラッシュの使用が問題だと思います。
もう考えたくないので、実際のブラウザーでスクリプトを実行してログインし、必要なファイルを取得することにしました。
要件は次のとおりです。
ヘッドレス、Xレスのスクリプト可能なブラウザーに適したツールキットはありますか?このようなことを試したことがありますか。もしそうなら、知恵の言葉はありますか?
私はIE埋め込みブラウザーで関連タスクを実行しました(ただし、ブラウザーコンポーネントパネルが非表示のguiアプリケーションです)。実際には、任意の レイアウトエンジン を使用して、出力ロジックをカットできます。ナビゲーションこれは、スクリプトのようなイベントを発生させることで行う必要があります。
Crowbar を使用できます。 Firefox(Geckoエンジン)のヘッドレスバージョンです。ブラウザをリクエストを受け入れることができるRESTfulサーバーに変えます( "fetch url")。したがって、htmlを解析し、DOMとして表し、実行されたすべてのスクリプトに対して定義された遅延を待機します。
Linuxで動作します。 JSと豊富なXULrunner機能を使用して、目的に合わせて簡単に拡張できると思います。
phantomjs はどうですか?
Selenium を試しましたか?これにより、Firefoxの拡張機能を使用して、使用シナリオを記録できます。これは、後でさまざまな方法で再生できます。
編集:これは非常に遅い応答であることに気づきました。 :)
WebKitDriver をご覧ください。プロジェクトにはWebKitのヘッドレス実装が含まれています。
フラッシュインタラクションの方法がわからない(また興味がある)が、html/javascriptの場合は Chickenfoot を使用できます。
Linuxでヘッドレス+スクリプト対応ブラウザを動作させるには、 Qt webkitライブラリ を使用できます。 これは使用例です 。