web-dev-qa-db-ja.com

埋め込みハイパーリンクを使用してブラウザからページをエクスポートするにはどうすればよいですか?

今日、悲しい発見をしました。 Ubuntu 10.04 LTSを使用しています。私のクライアントは広告ビジネスで、彼女は私にマーケティング競争の仕事をしてくれました。彼女は私に競争相手のウェブサイトを訪問して、そしてホームページをPDFとしてエクスポートしてほしかった。しかし、彼女は私に埋め込みハイパーリンクでそれをして欲しいと思っていました。

結局のところ、Ubuntu 10.04 LTS上のFirefox(さらには最新のChrome)でも、ハイパーリンクがPDF Webページのエクスポートに埋め込まれていません。

もちろん、PDFとしてエクスポートできるいくつかのChromeおよびFFプラグインがありますが、これらはプラグインをリモートでURLに接続し、PDFリモートで生成します。そして、ブラウザーでダウンロードを強制して、リモートの場所からダウンロードします。ただし、これらの競合他社のページの一部は初期ログインを必要とするため、これは私にとっては好ましくありません。つまり、PDFこれらのFFからの印刷またはChromeプラグインはログインページです。

Ubuntu 10.04で壊れたPDFプリンターを修正するために、この問題を回避する方法はありますか?

3
Volomike

使用するツールはwkhtmltopdfと呼ばれ、このツールはリポジトリーにありますが、一部のqtライブラリーのハックな変更により、コンパイルされたすべてのリポジトリーバージョンには埋め込みリンク機能がありません。

リポジトリからwkhtmltopdfをインストールして、すべての依存関係を取得します。

Sudo apt-get install wkhtmltopdf

次に、ここから 静的バージョンをダウンロードします。 ファイルをデスクトップに解凍し、binに移動します。

Sudo mv Desktop/wkhtmltopdf-i386 /usr/bin/wkhtmltopdf-static

これで、ツールを使用してリンク付きのpdfファイルを生成できます。

wkhtmltopdf-static http://google.com google.pdf

ログイン要件のあるWebサイトの場合、Firefoxを介してログインし、 Export Cookies firefoxプラグインを使用してCookieファイルをエクスポートする必要があります。 cookies.txtを使用すると、次のように実行できます。

wkhtmltopdf-static --cookie-jar cookies.txt http://google.com google.pdf

これらの多くはコマンドラインで実行する必要があることはわかっていますが、これが最善の方法であり、より多くの制御を取得できます。 wkhtmltopdfは非常に強力なツールです。