私はエレクトロニクスエンジニアであり、定期的にPDF回路図を表示します。多くの場合、「R1」などのコンポーネントの回路図を検索したいというシナリオに遭遇します。
問題は、「R1」を検索すると、回路図上のすべてのR [tens]とR [hundreds]にも一致することです。したがって、検索で正規表現を使用できるようにしたい、または少なくとも検索をより厳密に制御できるようにしたい(たとえば、Word全体を検索する)。
ここの誰かがこれらの機能をサポートするUbuntuで良いPDFツールを見つけましたか?
インストール pdfgrep :
Sudo apt-get install pdfgrep
そして、-C
オプションを使用すると、Wordの境界が一致します。
pdfgrep -C 0 '\<Word\>' file.pdf
または\b...\b
の代わりに\<...\>
を使用します。
man pdfgrep を参照してください
-C, --context NUM
Print at most NUM characters of context around each match.
グーグルで検索したところ JPedal(30日間トライアル) 。次のコマンドを使用して、コマンドラインからダウンロードして開きます。
Java -jar jpedal-trial.jar
今すぐ押す Ctrl+F、検索する単語を入力し、下矢印アイコン([単語全体を検索]をオンにします()Word全体を検索します。
ドキュメントのインデックスの作成に問題がなければ、 Recoll を使用できます。これは、完全なデスクトップ検索エンジンです。スクリーンショットとインストール手順については、 この回答 をご覧ください。
リコール検索は、 ワイルドカード および 修飾子 をサポートする poweful query language を使用して構築されます(例(proximityおよびslack)。
たとえば、クエリ"R1"l
は、Word全体の結果のみを生成します。これは、l
修飾子がステミングをオフにするためです。 (この特定の例では、Recollはデフォルトで数字のシーケンスを展開しないため、修飾子も必要ありません)。
問題が単語全体に検索を制限するだけである場合、それは十分簡単です。次のように、検索文字列の前後にスペースを追加するだけです:" R1 "
。私は常にこのテクニックをEvinceで使用しています。