[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: фильтрация почты (не спам) - bayes???



On Sat, Jan 21, 2006 at 08:52:47PM +0300, Ed wrote:
> вот что с ложными срабатываниями делать - не очень понятно

Ну один вариант я Вам, собственно, привел в предыдущем письме.
Дополнительные иерархии папок, в которые пользователь копирует письмо
при ложном (не)срабатывании фильтра. Но это требует обучения
пользователей, что (согласен с Вами), не очень хорошо.

Вообще можно просто сказать lda при доставке в папку добавлять заголовок
вроде X-Folder-Delievered-To: <имя папки в иерархии>, и по нему проверять
- скопировал пользователь это письмо из папки в папку или нет (если в
заголовке имя текущей папки - нет, иначе в заголовке имя папки из
которой письмо скопировано). Проверять на соответствие при этом нужно 
только файлы с ctime большим, чем время предыдущего запуска обучающего
скрипта на папке. Это, конечно, чуть медленнее, чем вариант с доп.
папками для обучения, но попробовать можно (и unix mailbox я просто не
рассматриваю - с ним бороться очень неудобно).

Еще не совсем понимаю пока вопрос с courier imap, отмечающим флаги
сообщения (seen,replied,deleted) переименованием файла с сообщением.
Возможно, что в данном случае нужно смотреть не на ctime, а на mtime.

Неприятным моментом может оказаться также и то, что пользователь может
удалить скопированное в папку письмо раньше, чем по нему обучится
фильтр (удалить как в смысле "удалить", так и в смысле "переместить в
локальную папку").

Еще вопрос: А как отмечать папки, для которых
никакие фильтры подобного типа работать не должны? Со всякими sent
понятно: у них этого заголовка нет. А в общем случае?

WBR
Dmitri Ivanov



Reply to: