web-dev-qa-db-ja.com

recollで検索する効果的な方法

私はしばらくの間recollを使用しています。そして私は絶対にそれを愛しています。私はすべてのジャーナル、電子ブック、写真、ビデオ、およびインターネット全体からのpdfの野生の束に索引を付けました。映画のレビューからコンピュータアルゴリズム、地中海料理のレシピに至るまで、さまざまなトピックがあります。実際のところ、私にとってrecollは、Googleに取って代わったようなものです。最初にrecollのローカルインスタンスを検索し、何も関連性がない場合にのみ、新しいタブでgoogleを開いて検索を開始します。

唯一の問題は.. recollを使用して検索する方法がまだよくわからない。ドキュメントを確認しましたが、少し混乱します。つまり、豊富なクエリ構文などすべてをサポートしています。

それで、recollを使用して効果的に検索する方法について誰かが考えているかどうか疑問に思っていましたか?どのような修飾子を使用できますか?そして、これらすべての修飾子は正確にはどういう意味ですか? 「l」、「p」、「o」、その他いくつかあります。これらの修飾子のいくつかは、たとえば「o10」のようにそれらに数字を追加することをサポートしています。ドキュメントは、それが正確に何を意味するのかについて非常に明確ではありません。 「ステミング」をオフにすると、より良い結果が得られる場合があります。しかし、正確にはわかりません。

誰かがもっと悟り、私を啓発できますか?ありがとう

4
Jay

このマニュアルのセクションをご覧になったことがあり、十分に明確ではなかったと思いますか? http://www.lesbonscomptes.com/recoll/usermanual/usermanual.html#RCL.SEARCH.LANG.MODIFIERS

ステミングとは、「floors」、「flooring」などの派生語をベースとする操作(語幹)であるfloorです。つまり、「floors」を検索すると、「floor」のみを含むテキストも検索されます。これは望ましくない場合があるため、Recollでは、用語(「Floors」)を大文字にするか、「l」修飾子を使用することで、これをオフにできます。

通常、Recollへの二重引用符で囲まれた入力は、中間用語なしで、指定された順序で入力用語を探すように指示します。 「first second」(実際にはエントリで二重引用符で囲まれています)を検索すると、[second first]または[first a second]のみを含むテキストは見つかりません

二重引用符で囲まれたエントリは、「p」修飾子を追加することで「近接検索」に変換できます。 "first second" pは、[first second]を含むテキストだけでなく、[second first]を含むテキストも検索しますが、[first a second]または[second first]だけを含むテキストは検索しません。

O修飾子を使用すると、間にある用語が表示されるように指定できます。たとえば、「first second」o1は[first second]と[first a second]の両方に一致します

ほとんどのクエリでは、このようなものはまったく必要ありませんが、時には、何百もの興味のない結果を見つけることと、必要な結果だけを見つけることとの間に違いが生じることがあります。

3
medoc