正規表現を使用してPDFを検索する方法

Question

通常、私はNotepad ++を使用して、正規表現を使用してファイルを検索します。今日、PDFに対して同じことを行うPDFプログラムがあるかどうか疑問に思っています。もちろん、PDFをテキストに変換して、Notepad ++を使用することもできますが、あります。変換せずにもっと簡単な方法は？

akira · Accepted Answer

いくつかのオプション：

Agent Ransack （インデックスサービスを使用せずにWindowsでファイルとコンテンツを*自信を持って*検索するための最良の方法は？）
DnGrep これはフリーでオープンソースのソフトウェアです。残念ながら、現時点ではWindowsでのみ利用可能です。（機能リクエストは他のプラットフォームに対して開かれていますここ）

minopret · Answer

あなたが言ったように、明白な代替手段はPDFをテキストに変換することです。プログラマーが一括処理用に設定する1つの方法は、PythonパッケージPDFMiner。エージェントRansackはXpdfプロジェクトの "pdftotext"を使用することです（あなたもそうすることができます）。