web-dev-qa-db-ja.com

PDF with Python

PDFデータコーパスのカスタム検索エンジンに取り組んでいます。

PDFコンテンツをテキストにダンプできる変換レイヤーがあります(Apache TikaとGROBIDを使用)。検索レイヤーと検索結果リストを返すビューが完成しました。

ここで、検索語が表示された行の元のPDFに強調表示機能を追加したいと思います。はい、PDFファイルの場合は変更します)必要です。

PDFファイル内のテキストを強調表示する方法はありますか?PDFMinerまたはPyPDF2または他のPythonライブラリはそれを行うことができますか?

...または、他の、おそらく外部サービスを推奨できますか?

8
Katharsis

PyPDF2 を使用してテキストを強調表示できます。

テキストの場所を見つけるには、 この回答 を確認してください。

4
spacevillain