通常、私はNotepad ++を使用して、正規表現を使用してファイルを検索します。今日、PDFに対して同じことを行うPDFプログラムがあるかどうか疑問に思っています。もちろん、PDFをテキストに変換して、Notepad ++を使用することもできますが、あります。変換せずにもっと簡単な方法は?
いくつかのオプション:
あなたが言ったように、明白な代替手段はPDFをテキストに変換することです。プログラマーが一括処理用に設定する1つの方法は、PythonパッケージPDFMiner。エージェントRansackはXpdfプロジェクトの "pdftotext"を使用することです(あなたもそうすることができます)。