web-dev-qa-db-ja.com

PDFのより良い検索機能

fooonetwoのような単語を1つのPDFで検索したい。つまり、本当の病棟がfoo_one_twoまたはfoo.one.twoまたはfoo-one-twoまたはfoo-one_twoかどうかはわかりません。 または..。

または、foo12を同時に含む単語を検索したいと言った方がいいでしょう。したがって、データベースにはこのような機能があることを覚えています。たとえば、fooで始まり、1および2を含む単語を検索するためのクエリです。それで、それを行うためのPDFビューアはありますか?PDFビューアとその方法。

pdfgrepを使用して、パターンを使用して.pdfファイル内を検索できます。まず、pdfgrepパッケージをインストールする必要があります。

 Sudo apt-get install pdfgrep

そして、あなたの命令は、

pdfgrep -in 'foo.one.two' file.pdf

上記のパターン内のドットは、どの文字とも一致します(リテラルドットを表すものではありません)。したがって、foo.one.twofoo-one-twofoo_one_twoが見つかります。

構文:

pdfgrep -in pattern file.pdf
3
Avinash Raj