Re: Анонс: легковесная система полнотекстового поиска
Hello!
On Friday 05 February 2010 18:25:46 Victor Wagner wrote:
> > Проверка по mtime имхо совершенно ненадежна, предпочитаю по хэшу.
>
> Зато - быстра. И то недостаточно Вот FBReader при старте делает mtime
> всем файлам, которые уже видел, так если его на миррор lib.rus.ec
> напустить, будет несколько минут взлетать (в смысле при повторном старте,
> когда индекс библиотеки уже построен).
>
> То есть при каждой перенидексации домашней директории (в которой лежат
> сотни гигов всякого барахла - кино, исходников, фотографий) считать хэш
> от всего этого безобразия - недопустимо большие накладные расходы.
Стоит решать названную задачу совсем другим методом. А именно - команда find
с нужными параметрами выбирает файлы, к примеру, изменившиеся за последние
24 часа и скармливает их список индексатору. Задача последнего - обновить
поисковый индекс при необходимости. Сам, кстати предпочитаю запускать
утилиту inotifywait, которая при добавлении/удалении файла вызывает нужный
скрипт обновления поискового индекса.
Best regards, Alexey Pechnikov.
http://pechnikov.tel/
Reply to: