Re: полнотекстовый поиск
Vladislav Naumov wrote:
Доброго времени суток!Встала задача организовать полнотекстовый поиск
по куче файлов разныхформатов на русском-английском языках.Навскидку в
дистрибутиве нашлись swish и swish++, по функционалупримерно
подходящие. Ухватился за swish++, как более популярный.
Странно это. Наиболее кошерный, по моему, swish-e. А пакета swish в
Debian так и вовсе нет.
Форматыфайлов поддерживает любые - только подгоняй конвертилку в plain
text.По-английски ищет без проблем, по русски - не удалось вообще.
Есть у кого-нибудь опыт борьбы с эти зверем?Может, есть что-нибудь лучше?
Может что лучше и есть, но вряд ли. Мне swish-e ищет без проблем хоть на
английском, хоть на русском языке.
Убедись, что у тебя в конфиге указано нечто вроде этого:
FuzzyIndexingMode Stemming_ru
MetaNames swishtitle swishdocpath UndefinedMetaTags
WordCharacters
.-_'abcdefghijklmnopqrstuvwxyzабвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ1234567890
BeginCharacters
abcdefghijklmnopqrstuvwxyzабвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ1234567890
EndCharacters
abcdefghijklmnopqrstuvwxyzабвгдеёжзийклмнопрстуфхцчшщъыьэюяАБВГДЕЁЖЗИЙКЛМНОПРСТУФХЦЧШЩЪЫЬЭЮЯ1234567890
IgnoreFirstChar .-_'
IgnoreLastChar .-_'
TranslateCharacters ёЁ_, еЕ-.
--
...Все еще сидишь на тарифе windows-1251? Переключись на новый, выгодный
тариф UTF-8 и говори в два раза больше!!
Reply to: