[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: полнотекстовый поиск



Vladislav Naumov wrote:
Доброго времени суток!Встала задача организовать полнотекстовый поиск по куче файлов разныхформатов на русском-английском языках.Навскидку в дистрибутиве нашлись swish и swish++, по функционалупримерно подходящие. Ухватился за swish++, как более популярный.
Странно это. Наиболее кошерный, по моему, swish-e. А пакета swish в Debian так и вовсе нет.

Форматыфайлов поддерживает любые - только подгоняй конвертилку в plain text.По-английски ищет без проблем, по русски - не удалось вообще.
Есть у кого-нибудь опыт борьбы с эти зверем?Может, есть что-нибудь лучше?

Может что лучше и есть, но вряд ли. Мне swish-e ищет без проблем хоть на английском, хоть на русском языке.
Убедись, что у тебя в конфиге указано нечто вроде этого:

FuzzyIndexingMode Stemming_ru
MetaNames swishtitle swishdocpath UndefinedMetaTags

WordCharacters .-_'abcdefghijklmnopqrstuvwxyzабвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ1234567890 BeginCharacters abcdefghijklmnopqrstuvwxyzабвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ1234567890 EndCharacters abcdefghijklmnopqrstuvwxyzабвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ1234567890
IgnoreFirstChar .-_'
IgnoreLastChar  .-_'
TranslateCharacters ёЁ_, еЕ-.

--
...Все еще сидишь на тарифе windows-1251? Переключись на новый, выгодный тариф UTF-8 и говори в два раза больше!!



Reply to: