PDFファイルがあり、PDFで特定のテキストを見つけて、Pythonを使用して強調表示しようとしています。見つけた PyPDF2 =、これは可能です PDFのハイライト部分 ファイル内の必要なハイライト位置の座標を指定する場合。
PDF内の特定のテキストの位置を教えてくれるツールを見つけようとしています。
PyMuPDF 座標でテキストを検索できます。これを PyPDF2ハイライト方法 と組み合わせて使用すると、説明していることを実現できます。または、 PyMuPDFを使用してテキストを強調表示する にすることもできます。
PyMuPDFでテキストを検索して強調表示するためのサンプルコードは次のとおりです。
import fitz
### READ IN PDF
doc = fitz.open("input.pdf")
page = doc[0]
text = "Sample text"
text_instances = page.searchFor(text)
### HIGHLIGHT
for inst in text_instances:
highlight = page.addHighlightAnnot(inst)
### OUTPUT
doc.save("output.pdf", garbage=4, deflate=True, clean=True)