Re: фильтрация почты (не спам) - bayes???
On Sat, Jan 21, 2006 at 08:04:08PM +0300, Ed wrote:
> >Имелось в виду "с бОльшим трудом". popfile
> >готовое решение, да еще написанное
> >на перле. От dbacl до сортировки почты еще
> >очень далеко, по крайней мере так
> >было некоторое время назад.
> dbacl выдает на что из списка более всего
> похоже. подсовываем список папок
> соответствующего пользователя и
> получаем на выходе в какую папку кидать
> письмо.
Начнем с того, что раньше dbacl не умел добавлять
"позитивы" к файлам категорий. Только полная регенерация.
Хотя он один из самых быстрых "баесов" был. Но
надо _на сервере_ держать всю учебную базу.
> >Это просто реализация не слишком сложного и
> >хорошо известного алгоритма. Хотя все
> >могло измениться.
> вот такую реализацию мне похоже и надо.
> остались мелкие вопросы:
> - качество фильтров;
При текстовой базе в сотни килобайт и далее -- хорошее
> - нормальная работа с русским текстом
> (кодировки, всякие quoted-printable);
Кодировки не очень важны, ты просто часть базы теряешь
на каждом тесте. mime, кажется, есть.
> - как обрабатывать ложные срабатывания.
Никак. Это же не спам. Ну попадет письмо в другую
категорию.
--
Иван Лох
Reply to: