[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: фильтрация почты (не спам) - bayes???



On Sat, Jan 21, 2006 at 09:10:44PM +0300, Ed wrote:
> >"позитивы" к файлам категорий. Только полная регенерация. Хотя он один из
> >самых быстрых "баесов" был. Но надо _на сервере_ держать всю учебную базу.
> 
> в случае imap - не проблема

Если у пользователей нет локальных архивов.

> >>- нормальная работа с русским текстом (кодировки, всякие quoted-printable);
> >>
> >Кодировки не очень важны, ты просто часть базы теряешь на каждом тесте. mime,
> >кажется, есть.
> 
> ну а зачем терять? хотя прикрутить наверное не так уж и сложно

Наверное, да. 

> >- как обрабатывать ложные срабатывания.Никак. Это же не спам. Ну попадет
> >письмо в другую категорию. 
> 
> ну заодно хочется тогда уж и спам обрабатывать. хотя со спамом можно проще
> поступить - делить на заведомый спам и подозрительные письма (которые уже
> быстро просмаривать и переносить в спам/входящие). все равно проще, чем всю
> почту разгребать.

Спаморезалки _больше_ чем просто байес. Во-первых, потому, что текста,
который и анализирует dbacl там, по большому счету, сейчас и нет.
Картинки, служебные поля и т.д. dbacl просто выбрасывает. 

-- 
Иван Лох



Reply to: