[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Анонс: легковесная система полнотекстового поиска



On Fri, Feb 05, 2010 at 08:36:11PM +0300, Alexey Pechnikov wrote:
> Hello!
> 
> On Friday 05 February 2010 20:15:18 Dmitri V. Ivanov wrote:
> > Вообще-то я писал на эту тему скриптик (поиск файлов, измененных с предыдущего
> > прохода в posix-овой файловой системе) и могу поделиться, если интересно.
> > На perl.
> 
> Да, интересно, в качестве обертки к индексатору.
>  
> > А хэш IMHO излишество.
> 
> Хэш - он не для поиска новых файлов, а для проверки необходимости 
> переиндексировать. Если хэш совпадает, индексатор с чистой совестью может 
> игнорировать файл.

Если система у нас - linux или freebsd (есть тонкие моменты в стандарте posix),
то для того, чтобы знать, что файл не менялся - достаточно ctime и списка каталогов
с их inode numbers. И можно с чистой совестью игнорировать. А посчитать хэш - это как
минимум прочесть файл с диска. Тот же gnu tar такое внутри себя умеет. Впрочем - дело
ваше.

WBR
Dmitri Ivanov


Reply to: