2000個の.ODTファイルがあるとします。それらの名前は乱数です。 「価格表」を検索する方法を教えてください。すべてを1つずつ開き、正しいかどうかを確認せずに、必要なドキュメントを見つけるにはどうすればよいですか?
文書内の単語を開かずに検索するプログラムはありますか?
これらのファイルの全文の索引付けをサポートするフィルターを備えた全文索引付けソリューションが必要になります。
このための1つのオプションは、Ubuntuのtracker
パッケージです。これにはtracker
とtracker-miner-fs
をインストールする必要があり、検索ツールUIにはtracker-gui
も必要になるでしょう。
代替手段は Recoll 。ファイルのインデックスが作成されると、一致するファイルが非常に高速に検出されます。 ODS、ODP、およびPDFの内部も検索します。かなりうまくいきます。
これは、openofficeが読み取ることができるすべてのものに対して機能します。私はこの場合にのみodtが欲しかった:
find -name \*.odt -exec sh -c 'unoconv --stdout -f text "{}" | grep -i string_to_search_for' \;