web-dev-qa-db-ja.com

複数のPDFおよびドキュメント内のテキストを検索します

私は他の学生によって書かれたメモの束を手に入れましたが、それらは同じ順序ですべてを扱っていなかった古い教科書からのものですので、私はすべての章のメモを検索する必要があります(個々の章はそれぞれ異なります。たとえば、「トレース調整」の場合はpdfまたは.doc)。

これにはGoogleデスクトップを使用していましたが、Launchyを使用してpdfを検索するように指示しましたが、コンテンツではなくタイトルのみを検索します。

助けてくれてありがとう。

36
Rabbit

Recoll は、おそらくLinuxで最も用途の広いドキュメント検索エンジンです。

enter image description here

多数の異なるフォーマットをサポートし、非常にカスタマイズ可能です。

インストール手順やその他のポインタについては、 この回答 をご覧ください。 公式ドキュメント も非常に便利です。

31
Glutanimate

パッケージをインストールしますpdfgrep

Sudo apt-get install pdfgrep

次のコマンドを使用します。

find /path -iname '*.pdf' -exec pdfgrep pattern {} +
22
Edward Torvalds

DocFetcher を使用します。これは、複数のドキュメントタイプのインデックス作成と検索を行うネイティブLinuxアプリケーションです。

4
labnut

Adobe Readerはプロプライエタリなソフトウェアであることを理解していますが、よく設計されたファイル内検索機能(Edit->Searchメニューまたはを押して Ctrl+Shift+F)。

シンプルな検索オプション

Simple searchウィンドウを以下に示します。

Simple search in Adobe Reader

検索する場所を設定する必要がありますか?All PDF Documents inしてから場所を選択しますドロップダウンメニューから(場所の参照)。

どの単語またはフレーズを検索しますか?フィールドに検索項目を入力し、検索オプションを指定できます:単語のみ大文字と小文字を区別するブックマークを含めるコメントを含める

高度な検索オプション

高度な検索はより設定可能です-下の画像を参照してください:

Advanced Search

検索パスはLook Inで設定されます。
アイテムの検索-で検索する単語またはフレーズは何ですか?
を含む結果を返すには、オプションがあります:完全に一致する単語または語句単語のすべての単語に一致するブールクエリ

その他のオプションには、Whole words onlyCase-SensetiveProximityステミングブックマークを含めるコメントを含める添付ファイルを含める


注: 他のスレッドで の説明に従って、ネイティブAdobe Readerバージョン9.5.5をインストールできます。

0
N0rbert