[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Борьба со спамом



On Thu, May 18, 2006 at 03:20:59PM +0400, Kirill Frolov wrote:
>   Сколько не корми sa-learn спамом -- всё равно лезет. МНОГО.
> Чего бы ещё такое не сильно нудное сделать?
> 
>   Вот у меня в другом месте немеряных размеров procmail есть. Я туда
> ip-адреса (с маской 255.255.255.0) записываю. Помогает неделю. Потом
> опять. Телефоны тоже туда записываю. Так они их, гады, теперь шифруют
> по-всякому. Да и сами телефоны всё время разные. :-(
> 
>   Всё-таки с телефонами, наверное, самая верная затея...

procmail обманывается с телефонами легче легкого. Например если письмо в
html вместо телефона 1234567 пишем
1<unexistant>2</unexistant>3<notag>4</notag>... Парсер html обязан
игнорировать неизвестные ему tags.

Вообще необучаемость spamassassin кажется мне странной. Вроде народ
пользуется и не жалуется. Сам для своей почты использую в качестве
фильтра bogofilter. Обучаю на ошибках. Сегодня пропустил 2 сообщения
спама (визуально одинаковых). Обычно - ни одного вообще (по ощущениям -
не прикручивал статистику к своей "обучалке", хотя и не проблема).

Обучение через копирование ошибочно классифицированного как ham
сообщения в папку INBOX.markspam (для spam INBOX.markham). Обучает
скрипт, запускаемый cron (системный пользователь у папки courier,
кладется все в maildir-ы, доставщик в моем случае courier maildrop,
скрипт запускается с теми же правами). Скрипт просто обучает bogofilter
по сообщениям в папке, после чего их удаляет. Запускается не то раз в
час, не то раз в 15 минут (не суть важно, а смотреть лень).

Учитывая не самый удачный формат базы у bogofilter раз в несколько
недель её приходится пропускать через bogoutil -d <база>| bogoutil -l
<база.tmp> && .....

На скольки пользователях какую загрузку создаст такое решение - не знаю
(пользуюсь один - юзерам пока хватает и mozilla :)))). У меня лично база
порядка 5 мегабайт (была когда последний раз смотрел).

А кормить прямиком procmail - IMHO дело дохлое (можно попробовать через
bogolexer).

WBR
Dmitri Ivanov



Reply to: