
私はしばらく recoll を使っています。そして、本当に気に入っています。すべての日記、電子書籍、写真、ビデオ、そしてインターネット上のさまざまな PDF をインデックス化しています。トピックは映画レビューからコンピューター アルゴリズム、地中海料理のレシピまで多岐にわたります。実際、私にとって recoll は、まずローカルの recoll インスタンスを検索し、関連するものが見つからない場合にのみ、新しいタブで Google を開いて検索を開始するという意味で、Google に取って代わったようなものです。
唯一の問題は、recoll を使用して検索する方法がまだよくわからないことです。ドキュメントを確認しましたが、少しわかりにくいです。豊富なクエリ構文などをサポートしているということです。
そこで、recoll を使用して効果的に検索する方法をご存知の方がいらっしゃいましたら、教えてください。どのような修飾子を使用できますか。また、それらの修飾子は正確には何を意味するのでしょうか。「l」、「p」、「o」などがあります。これらの修飾子の一部は、たとえば「o10」のように、数字を追加できます。ドキュメントでは、それが正確に何を意味するのかがあまり明確ではありません。時々、「ステミング」をオフにすると、より良い結果が得られるようです。しかし、よくわかりません。
もっと詳しい人が私に教えてくれませんか?ありがとう
答え1
このマニュアルのセクションをご覧になったと思いますが、十分に明確ではなかったのでしょうか? http://www.lesbonscomptes.com/recoll/usermanual/usermanual.html#RCL.SEARCH.LANG.MODIFIERS
ステミングとは、「floors」、「flooring」などの派生語を基本語 (語幹) floor に変換する操作です。つまり、「floors」を検索すると、「floor」のみを含むテキストも検索されます。これが望ましくない場合もありますので、Recoll では、語を大文字にする (「Floors」) か、'l' 修飾子を使用して、ステミングをオフにできます。
通常、二重引用符で囲まれた入力は、中間語を除いた順序で入力語を検索するように Recoll に指示します。"first second" (実際にはエントリ内で二重引用符で囲まれています) を検索しても、[second first] または [first a second] のみを含むテキストは検索されません。
二重引用符で囲まれたエントリは、'p' 修飾子を追加することで「近接検索」に変えることができます。"first second"p は、[first second] を含むテキストだけでなく、[second first] を含むテキストも検索しますが、[first a second] または [second a first] のみを含むテキストは検索しません。
o 修飾子を使用すると、間に挟まれる用語がいくつか出現することを指定できます。たとえば、"first second"o1 は [first second] と [first a second] の両方に一致します。
ほとんどのクエリでは、このような機能はまったく必要ありませんが、場合によっては、興味のない結果が何百も見つかるか、必要な結果が 1 つだけ見つかるかの違いを生むことがあります。