[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: фильтрация почты (не спам) - bayes???



Иван Лох wrote:

вот этот тест несколько разочаровывает:
http://sam.holden.id.au/writings/spam2/

Выберете любой другой баес.

вот я и хочу понять - какой именно и чем они различаются

Или последуйте дельному совету Артема
Чуприны.

не использовать автоматическую сортировку почты?
я так и не понял почему

Спаморезалки _больше_ чем просто байес. Во-первых, потому, что текста,
который и анализирует dbacl там, по большому счету, сейчас и нет.
Картинки, служебные поля и т.д. dbacl просто выбрасывает.

Перечитайте это еще раз и вдумайтесь над понятием токенизации.
Потом откройте 10 писем со спамом (особенно HTML) и найдите
там лексические токены c которыми работет dbacl.

я это уже понял.
я рассуждаю так - если можно было получить спаморезалку как побочный эффект от сортировки - замечательно, нет - ничего страшного

не совсем понятны разные результаты у систем, работающих по одному алгоритму.

Я счастлив за Вас и авторов этого теста тоже. Авторы дебиановского пакета включили статьи Брейера в пакет
dbacl. Вы их _начинали читать?_ Или Вы принципиально не читаете
даже ответы на вопросы которые задаете?

ответы на свои вопросы я читаю очень внимательно. статьи же я не начал читать - ибо невозможно изучить документацию к нескольким десяткам спаморезалок (я подозреваю, что почти любую из них можно заточить для сортировки почты).

Вам же написали в первом письме dbacl _с большим трудом_
_C большим трудом_ и означет чтение этих статей.

бегу читать ;)

Если Вы не хотите их читать, то берите предложенный Вам popfile.

он сортирует на клиенте (вернее - в момент отдачи письма клиенту), а не на сервере. хотя похоже это можно побороть.



Reply to: