web-dev-qa-db-ja.com

PDFをHTMLに変換するPython

PythonでPDFファイルをHTMLに変換するにはどうすればよいですか？

PDFファイルをインデックスに登録するためにGoogleが行っている（または行っているように見える）行を何かだけで考えていました。

私の最終的な目標は、ApacheをセットアップしてPDFファイルのHTMLを表示することです。そのため、その方向に私を導いてくれるものもいただければ幸いです。

pythonhtmlapachepdf

23

2008/11/09Marcos Lara

poppler パッケージは、使用可能なpdf2htmlユーティリティを提供します。 libpopplerには Pythonバインディングもあります。

5

2008/11/09Martin v. Löwis