[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: фильтрация почты (не спам) - bayes???



On Sat, Jan 21, 2006 at 08:04:08PM +0300, Ed wrote:
> >Имелось в виду "с бОльшим трудом".  popfile 
> >готовое решение, да еще написанное
> >на перле. От dbacl до сортировки почты еще 
> >очень далеко, по крайней мере так
> >было некоторое время назад.
> dbacl выдает на что из списка более всего 
> похоже. подсовываем список папок 
> соответствующего пользователя и 
> получаем на выходе в какую папку кидать 
> письмо.
Начнем с того, что раньше dbacl не умел добавлять
"позитивы" к файлам категорий. Только полная регенерация.
Хотя он один из самых быстрых "баесов" был. Но
надо _на сервере_ держать всю учебную базу.

> >Это просто реализация не слишком сложного и
> >хорошо известного алгоритма. Хотя все 
> >могло измениться.
> вот такую реализацию мне похоже и надо.
> остались мелкие вопросы:
> - качество фильтров;
При текстовой базе в сотни килобайт и далее -- хорошее
> - нормальная работа с русским текстом 
> (кодировки, всякие quoted-printable);
Кодировки не очень важны, ты просто часть базы теряешь
на каждом тесте. mime, кажется, есть.
> - как обрабатывать ложные срабатывания.
Никак. Это же не спам. Ну попадет письмо в другую
категорию. 


-- 
Иван Лох



Reply to: