web-dev-qa-db-ja.com

PDFファイルでテキストの位置を見つける

PDFファイルがあり、PDFで特定のテキストを見つけて、Pythonを使用して強調表示しようとしています。見つけた PyPDF2 =、これは可能です PDFのハイライト部分 ファイル内の必要なハイライト位置の座標を指定する場合。

PDF内の特定のテキストの位置を教えてくれるツールを見つけようとしています。

8
Simdan

PyMuPDF 座標でテキストを検索できます。これを PyPDF2ハイライト方法 と組み合わせて使用​​すると、説明していることを実現できます。または、 PyMuPDFを使用してテキストを強調表示する にすることもできます。

PyMuPDFでテキストを検索して強調表示するためのサンプルコードは次のとおりです。

import fitz

### READ IN PDF

doc = fitz.open("input.pdf")
page = doc[0]

text = "Sample text"
text_instances = page.searchFor(text)

### HIGHLIGHT

for inst in text_instances:
    highlight = page.addHighlightAnnot(inst)


### OUTPUT

doc.save("output.pdf", garbage=4, deflate=True, clean=True)
10
Cilantro Ditrek