WebページをPDF(オンラインサービス、ブックマークレット、印刷先PDFソリューションなど))に変換する方法はたくさんあります。
しかし、これらのどれも検索可能なPDFを生成しません。それらはすべてHTMLを1つの巨大な画像に変換しているようです。 Webページを検索可能なPDFに変換する方法はありますか?
wkhtmltopdf プロジェクトが見つかりました。これでうまくいくようです。これはコマンドラインなので、少し学習曲線がありますが、それほど悪くはありません。
特にWebページを変換するには、wkhtmltopdf
がインストールされているディレクトリでコマンドウィンドウを開き、以下を実行します。
wkhtmltopdf.exe http://www.yourpage.com/index.htm c:\misc\cnn.pdf
アプリケーションには、必要に応じて出力を微調整するように設計されたとんでもない量のオプションがありますが、デフォルトではかなり良い結果が得られます。
CutePDFライター テキスト処理にGhostScriptを使用し、次にps2pdfを使用してWebページの検索可能なPDFを作成します。もちろん、ページ上のテキストが最初から画像である場合、これは機能しません。
Print to PDFソリューションの問題は何ですか?システムに2つの仮想プリンターをインストールしました: PDF Creator &Adobe AcrobatXの仮想プリンター。どちらも正常に動作します。 PDFビューアにOCR機能がある限り(最近では一般的です)、生成されたPDFのテキストを簡単に検索できます。
テキストやWord文書のようなものを作成することを考えている場合、それはできません。 PDF形式の制限、またはPDF形式の動作方法を説明します。これにより、フォントなどを依存せずにこの形式に埋め込んで作成できます。ユニバーサル。
そして、私はそうは思わない wkhtmltopdf プロジェクトはPDFファイルを生成でき、OCRテクノロジーを使用せずにテキストを検索できるため(違反PDF仕様)。
私はAdobeAcrobat 8 Professionalを使用しています(現在のバージョンは Adobe Acrobat X です)。 URLを要求するメニューオプションFile... Create PDF... From Web Page...
があり、URLのページをPDFファイル、検索可能なテキスト付きでダウンロードします。また、リンクされているページを変換します。そのページから再帰的に。1つのマルチページPDFファイルに、ページ間のリンクを保持したまま、多くのHTMLページを作成することができます。
一部のWebページでは、Acrobat Create PDFのフォーマットが間違っています。その場合、Acrobat 8ProfessionalがシステムにインストールしたAdobe PDF 8.0
プリンタードライバーにフォールバックします。非常に優れています。 PDF私が見ているWebページに相当し、検索可能なテキストが含まれています。
Adobe Acrobat 8Professionalはフリーソフトウェアではありません。それは完全に価格設定されたプロプライエタリソフトウェアです。ただし、私見では、Microsoft Officeと同じように、すべてのナレッジワーカーのコンピューターに配置する価値があります。そして、あなたはWebページを検索可能なPDFに変換するためのフリーソフトウェアの方法を主張したことを指定しませんでした。
これは、Webページを検索可能なPDFに変換する非常に優れたツールです: http://kitpdf.com/web_to_pdf/ 。それを試してみて、それがあなたのニーズを満たしているかどうかを確認してください。
このページをGoogleで印刷しましたChromeそしてPDFとして保存しました。印刷したPDFファイルで検索を使用しても問題ありません。ページに含まれている場合、出力はページタイプによって異なる場合がありますフラッシュフレーム-そうすると、おそらくそこでコンテンツを検索できなくなります。
GrabzIt Webページを完全に検索可能なPDFに変換できます。さらに、無料の オンラインスケジュールタスクツール を提供します。これは、コーディングが不要であることを意味します。
PrimoPDF!これは無料。それは完璧に機能し、印刷できるものはすべてPDF(検索可能)に変えることができます。それ自体を新しいプリンターとして追加することで機能します。アンインストールも簡単です。
お役に立てれば。