web-dev-qa-db-ja.com

正規表現PDF search?

私はエレクトロニクスエンジニアであり、定期的にPDF回路図を表示します。多くの場合、「R1」などのコンポーネントの回路図を検索したいというシナリオに遭遇します。

問題は、「R1」を検索すると、回路図上のすべてのR [tens]とR [hundreds]にも一致することです。したがって、検索で正規表現を使用できるようにしたい、または少なくとも検索をより厳密に制御できるようにしたい(たとえば、Word全体を検索する)。

ここの誰かがこれらの機能をサポートするUbuntuで良いPDFツールを見つけましたか?

2
Brian J Hoskins

インストール pdfgrep

Sudo apt-get install pdfgrep

そして、-Cオプションを使用すると、Wordの境界が一致します。

pdfgrep -C 0 '\<Word\>' file.pdf

または\b...\bの代わりに\<...\>を使用します。

man pdfgrep を参照してください

-C, --context NUM
      Print at most NUM characters of context around each match.

グーグルで検索したところ JPedal(30日間トライアル) 。次のコマンドを使用して、コマンドラインからダウンロードして開きます。

Java -jar jpedal-trial.jar

今すぐ押す Ctrl+F、検索する単語を入力し、下矢印アイコン([単語全体を検索]をオンにします(enter image description here)Word全体を検索します。

enter image description here

2
αғsнιη

ドキュメントのインデックスの作成に問題がなければ、 Recoll を使用できます。これは、完全なデスクトップ検索エンジンです。スクリーンショットとインストール手順については、 この回答 をご覧ください。

リコール検索は、 ワイルドカード および 修飾子​​ をサポートする poweful query language を使用して構築されます(例(proximityおよびslack)。

たとえば、クエリ"R1"lは、Word全体の結果のみを生成します。これは、l修飾子がステミングをオフにするためです。 (この特定の例では、Recollはデフォルトで数字のシーケンスを展開しないため、修飾子も必要ありません)。

1
Glutanimate

問題が単語全体に検索を制限するだけである場合、それは十分簡単です。次のように、検索文字列の前後にスペースを追加するだけです:" R1 "。私は常にこのテクニックをEvinceで使用しています。

0
Brian Z