コマンドラインからクエリを実行でき、理想的にはGUIをまったく使用する必要がない、フルテキストインデックスエンジンのようなものはありますか?
私は特に電子ブックとペーパーの索引付けに興味があるので、それはpdf、epub、およびいくつかのdjvuの混合です。 (オープン)Officeドキュメントはいいですが、私のリストでははるかに低いです。
LuceneまたはSphinxを見たことがありますか?インデックスを作成するドキュメントを最初に解析する必要がありますが、それが完了すると、どちらもcliから検索できます。
Luceneの場合、これを実行するための情報 利用可能 があります。
Sphinxはもう少しあいまいですが、いくつかのドキュメント available もあります。選択した構造化XMLデータをxmlpipe2データソースを介してsphinxに渡すことができます。
LuceneはJavaに依存していますが、SphinxはC++で構築されており、外部の依存関係は必要ありません。
どちらの方法でも、やりたいことを行うには少し手間がかかりますが、完全に実行可能なソリューションのようです。
チェックアウト xapian 。コマンドラインインターフェイスがあり、多くの形式のインデックスを作成できます。
この回答 Googleの使用を推奨 codesearch 、
コード検索は、インデックスを作成し、ソースコードの大きな本体に対して正規表現検索を実行するためのツールです。
Debian /誘導体のスーパーユーザーは以下を試すことができます:Sudo apt-get install codesearch
トラッカーはコマンドラインから呼び出すことができ、gtk +はプロジェクトのハードな依存関係ではありません(ただしパッケージの場合があります)。
現在Trackerには、安定(0.8)と不安定(0.9)の2つのストリームがあります。お使いのOSには0.8バージョンが含まれている可能性が高いため、余裕があれば( 最先端 ソフトウェアの依存関係がある場合)、最新のtarfile(0.9.x)を入手してください。それは たくさんの改善 0.8を超えており、現在 安定化中 でさらに0.10です(偶数は安定性を表します)。このルートを選択した場合は、次のコマンドを使用して構成します。
./configure --disable-tracker-needle --disable-tracker-preferences --disable-tracker-Explorer --disable-tracker-status-icon
おそらく依存関係をインストールするつもりはないので、単にディストリビューションから0.8をインストールし、GUIビットを回避するだけの方が簡単です。 Debian Squeeze、Ubuntu 10.10、Ubuntu 11.04では、これらはうまく分割されています。 ( ルートとして )実行:
apt-get install --no-install-recommends tracker-utils tracker-miner-fs
このためのCLIツールはtracker-search
であるため、--help
オプションを指定して実行すると、それを活用する方法がわかります:-)
メモ:
tracker-applet
やtracker-preferences
などが含まれているためだと思います。ただし、GUI検索インターフェイスであるtracker-search-tool
用の個別のパッケージはあります。