Эффективные способы поиска в памяти

Эффективные способы поиска в памяти

Я уже некоторое время пользуюсь recoll. И он мне безумно нравится. Он проиндексировал все мои журналы, электронные книги, фотографии, видео, а также дикую кучу pdf-файлов со всего интернета. Темы охватывают от обзоров фильмов до компьютерных алгоритмов и средиземноморских рецептов. Фактически, для меня recoll в некотором роде заменил Google в том смысле, что... Сначала я ищу свой локальный экземпляр recoll, и только когда не нахожу ничего подходящего, открываю Google в новой вкладке и начинаю поиск...

Единственная проблема в том, что... Я все еще не уверен, насколько хорошо искать с помощью recoll. Я просмотрел документацию, и она немного запутанная. Я имею в виду, что она поддерживает богатый синтаксис запросов и все такое.

Поэтому мне было интересно, есть ли у кого-нибудь идеи, как эффективно искать с помощью recoll? Какие модификаторы я могу использовать и т. д.? И что именно означают все эти модификаторы? Есть «l», «p», «o» и несколько других. Некоторые из этих модификаторов поддерживают добавление к ним чисел, например, «o10». В документации не очень ясно, что именно это означает. Иногда кажется, что отключение «стемминга» дает мне лучшие результаты. Но я не совсем уверен.

Может ли кто-то более просвещенный просветить меня? Спасибо

решение1

Полагаю, вы просмотрели этот раздел руководства и обнаружили, что он недостаточно ясен? http://www.lesbonscomptes.com/recoll/usermanual/usermanual.html#RCL.SEARCH.LANG.MODIFIERS

Стемминг — это операция, которая превращает производный термин, например, «floors», «flooring», в базовый (основу): floor. Это означает, что поиск по слову «floors» также найдет тексты, содержащие только слово «floor». Иногда это нежелательно, поэтому Recoll позволяет отключить его, написав термин с заглавной буквы («Floors») или используя модификатор 'l'.

Обычно ввод в двойных кавычках для Recoll указывает ему искать входные термины в указанном порядке, без каких-либо промежуточных терминов. Поиск "first second" (фактически двойные кавычки в записи) не найдет тексты, содержащие только [second first] или [first a second]

Запись в двойных кавычках можно превратить в «поиск по близости», добавив модификатор «p». «first second»p найдет тексты, содержащие [first second], а также тексты, содержащие [second first], но не только тексты, содержащие [first a second] или [second a first].

Модификатор o позволяет указать, что могут появиться некоторые промежуточные термины. Например, "first second"o1 будет соответствовать как [first second], так и [first a second]

Для большинства запросов эти вещи вам вообще не нужны, но иногда они могут сыграть решающую роль в поиске сотен неинтересных результатов или только одного нужного.

Связанный контент