無料または有料(約50 $/40ポンド)[〜#〜]バッチ[〜#〜]PDFをHTMLに変換して、複数PDFファイルを一度に変換します。
ファイル内のベクトル化された画像とビットマップ画像を処理できる必要があり、両方をhtmlページで参照されるjpegとして出力します。
Iorigsoft有料PDFをHTMLに試してみました-ハングしたりアイドル状態になったりする問題があり、実際に変換されるもののリンクが壊れています-構成要素の章にhtmlとして間違った名前が使用されています。
また、intrapdf.comからのアプリケーションを試しましたが、これは変換の開始近くで一貫してクラッシュします。
更新:
intrapdfは、Windows XPマシンでは機能しますが、Windows7マシンでは機能しません。唯一の不具合は、フレーム化されたインデックスコンテンツhtml(ページ内のグラフィックがフレーム内のページに表示されない)にありますが、新しいタブでのみフレームを開くと、それらを表示できます。これは、chromeのみのブラウザの不具合である可能性があります。
この解決策は私にとっては十分です-私はすでにお金を使っています(私が尋ねる前に使っていました)が、これはWindows 7では機能しないため、自分の答えを受け入れることができません。
オープンソースツールを調べましたが、同じように不安定に見えるか、古いPDFバージョンを使用しています。
Windows 732ビットホームで必要です。
考え?
私の解決策は、2つの部分1)IntraPDF PDF to JPGプログラムを引き続き使用することです(私はそれを支払いました)( http://www.intrapdf.com/ XPプラットフォーム上のconvert_pdf_to_html.htm )(Windows 7 Home 32ビットでは動作しないようです。ハングします)。
しかし、@ geekosaurは、PDFとHTMLの目標が異なるため、翻訳/変換が正確ではなく(おそらく、CSSがHTMLに適用されている場合でも)、実際には結果のHTML Iいくつかのページで見たように、同じではないフォーマットがありますが、それは可能です。
したがって、ソリューションの2番目の部分は、無料のアプリケーションプログラムツールIrfanViewを使用してPDFからJPGに変換することです。PDFドキュメントは、ドキュメントページごとに1つずつ、一連のJPG画像です。 。これはセットアップが簡単で、IrfanViewビューはプラグインスイートの一部としてPDF変換をパッケージ化し、PDFの前提条件は、IrfanViewがリンクを提供するGhostViewをダウンロードすることです。これは非常にうまく機能しますが、プロセス中にUIがハングすることがありますが、変換は続行されます。
私の目標を明確にするために、私は、将来ドキュメントを表示するためのより多くの可能性を私に与えるであろう非独占的なフォーマットのpdfドキュメントが欲しかった。 PDFはかなりユビキタスですが、フォーマットに縛られていないので、データが無料であることが好きです。
他の貢献者に感謝します:
@ AffineMesh94464: http://www.iceni.com/gemini-features.htm (これは試していませんが、すでに支払っていますこれを合理的に行うツールの場合、私はおそらく別のツールを購入するつもりはありません)。
@Sathya: http://www.okdosoft.com/okdo-pdf-to-all-converter-professional.htm (よさそうですが、私は得ましたエラーメッセージ、Microsoftコンポーネントが必要だったようなもの)。
PDFはお粗末な変換用の入力形式であるため、「フレーク」はほとんどルールではありません。一部のファイルは比較的簡単に変換できますが、ほとんどのwillに問題があります。 (非常に簡単に:a PDFファイルは「ここに移動、これを出力、そこに移動、...」の圧縮リストです。ドキュメントに何か以外が含まれている場合単純なLからRへのテキスト(表、画像、RTLテキスト、脚注など)を変換すると、おそらくある程度のゴミが発生します。)
Canvas要素を使用するPDF.jsと呼ばれるHTMLJavascriptベースのPDFレンダラーがあります。 http://mozilla.github.com/pdf.js/web/viewer.html
それは開発中ですが、それはいくつかのために仕事をするかもしれません。
Openoffice/libreofficeに変換用のコマンドラインフラグがあるかどうかを確認します。
PDFは、あなたがやろうとしていることを嫌います。 PDFページの表示方法とHTMLのページの表示方法の間には、ドキュメントモデルの大きな不一致があります。変換できないファイルがPDF何でも簡単にHTMLに。
Iceniバッチの「Gemini」はPDFドキュメントをHTMLに変換します...
http://www.iceni.com/gemini-features.htm
出力は100%完全ではありませんが、許容できる場合があります。そして、それは仕事をするのに良い拠点です。あなたが完璧主義者なら、ポストプロダクションの「検索と置換」は通常、ほとんどの問題を解決することができます。
試すことができます Okdo PDF to HTML Converter
無料のオープンソースコマンドラインツールがあります http://sourceforge.net/projects/pdftohtml/ 。
簡単な評価の結果、現在、主に単純なドキュメントに適しているようです。複雑なフォーマットは異なる場合があります。
ラテン語以外のエンコーディングでは動作が悪くなります。
もあります FREE PDF to HTML
ツールによる http://www.freepdfsolutions.com 。
バッチサポート付きのシンプルなGUIを備えています。広告なし。
非常に単純な防弾トリックで同じフォーマットを維持するのに苦労しています。すべてのグラフィックは、すべてのページに単一の大きな背景jpg画像にレンダリングされます。また、htmlのすべてのテキストdivは絶対配置を使用します。これにより、正確に見える結果が得られますが、サイズが大きく、HTMLが醜いです。