PDFデータコーパスのカスタム検索エンジンに取り組んでいます。
PDFコンテンツをテキストにダンプできる変換レイヤーがあります(Apache TikaとGROBIDを使用)。検索レイヤーと検索結果リストを返すビューが完成しました。
ここで、検索語が表示された行の元のPDFに強調表示機能を追加したいと思います。はい、PDFファイルの場合は変更します)必要です。
PDFファイル内のテキストを強調表示する方法はありますか?PDFMinerまたはPyPDF2または他のPythonライブラリはそれを行うことができますか?
...または、他の、おそらく外部サービスを推奨できますか?