spam filter in debian-russian or report on test
Добрый вечер, All,
Заранее прошу прощения, если мои предыдущие "тесты" кого-то достали.
Пару недель пробовал посылать сюда письма, но они не попадали в
лист. Когда мне это надоело, попытался разобраться. Вот выводы к
которым я пришел.
Примерно с сентября сообщения в данный лист проходят через
программу, которая оставляет в заголовке каждого сообщения строки
вида:
X-Spam-Status: No, hits=1.1 required=4.0
tests=SPAM_PHRASE_00_01,USER_AGENT_THEBAT
version=2.43
X-Spam-Level: *
До какого-то времени эта программа для писем подозрительных на спам
ограничивалась отчетом в заголовке вида:
X-Spam-Status: Yes, hits=10.8 required=4.7 tests=NO_REAL_NAME,CLICK_BELOW,EXCUSE_3,EXCUSE_7,NORMAL_HTTP_TO_IP,REMOVE_PAGE,A_HREF_TO_REMOVE,FREQ_SPAM_PHRASE,FORGED_YAHOO_RCVD version=2.01
X-Spam-Flag: YES
X-Spam-Checker-Version: SpamAssassin 2.01 (devel $Id: SpamAssassin.pm,v 1.61 2002/01/25 04:41:02 jmason Exp $)
X-Spam-Prev-Content-Type: multipart/alternative; boundary="----=_NextPart_279_48363782368241474081115848"
X-Spam-Report: 10.81 hits, 4.7 required;
* 1.2 -- From: does not include a real name
* 0.0 -- BODY: Asks you to click below
* 1.0 -- BODY: Claims you can be removed from the list
* 0.0 -- BODY: Claims you can be removed from the list
* 1.0 -- BODY: Uses a dotted-decimal IP address in URL
* 2.3 -- BODY: URL of page called "remove"
* 1.8 -- BODY: Link to a URL containing "remove"
* 1.6 -- Contains phrases frequently found in spam
[score: 15, hits: absolutely free, cannot]
[considered, click here, considered spam, please]
[click, removed from, sent compliance, this]
[email, you wish]
* 1.9 -- Forged yahoo.com 'Received:' header found
Но в определенный момент стало так, что сообщения в X-Spam-Status: Yes
просто не доходят в рассылку, т.е. включили спам фильтр.
Это собственно вводная. Проблема заключается в том, что судя по
всему хинт определения спама "Subject is all capitals" имеет очень
высокий приоритет, во всяком случае сравнивая:
Message-ID: <[🔎] 3DDE45C7.6010105@avanto.mpei.ac.ru>
Subject: python gtk
X-Spam-Status: No, hits=-0.5 required=4.0
tests=SPAM_PHRASE_00_01,USER_AGENT,USER_AGENT_MOZILLA_UA,
X_ACCEPT_LANG
version=2.43
Message-ID: <[🔎] 3DDFC137.2050509@ezmail.ru>
Subject: =?KOI8-R?Q?=D4=C5=D3=D4?=
X-Spam-Status: No, hits=3.3 required=4.0
tests=SPAM_PHRASE_00_01,SUBJ_FULL_OF_8BITS,USER_AGENT,
USER_AGENT_MOZILLA_UA,X_ACCEPT_LANG
version=2.43
видим, что при отличии в успешно пройденных спам тестах только в
SUBJ_FULL_OF_8BITS разница в хинтах (по которым осуществляется
предположение спам/не спам) в 3.8, а во втором заголовке всего лишь
русские буквы, т.е. русские буквы в заголовке почти тождественны
спаму.
Плюс к этому неравенство почтовых агентов. Так например письмо
полностью по содержанию и теме идентичное Message-ID:
<[🔎] 3DDFC137.2050509@ezmail.ru> (последний фрагмен), но написанное из
The Bat! не прошло вообще. Письмо отличающееся лишь темой (test) и
написанное также в The Bat!:
Message-ID: <[🔎] 6121723446.20021123202135@ezmail.ru>
Subject: test
X-Spam-Status: No, hits=1.1 required=4.0
tests=SPAM_PHRASE_00_01,USER_AGENT_THEBAT
version=2.43
получает сразу хинт 1.1 (видимо мышка мордой не вышла).
Резюме
Конечно есть еще множество факторов, но фокус в том, что с The Bat!
написать письмо с РУССКОЙ темой в РУССКУЮ рассылку сейчас
практически не реально.
ЗЫ листмастеру listmaster@lists.debian.org я написал спросил о том
возможно ли общение с ним на русском языке. Если он ответит, что
можно, то я сам с ним переговорю по этому вопросу, но если он может
общаться только на английском, как впрочем и на любом другом языке
отличном от русского, я пас. Английский я могу читать со словарем,
ну часть доков почитать без, но писать на нем я не могу. Тогда
возможно кому-то другому придется с ним попереписыватся.
--
Всего наилучшего,
Anseis mailto:anseis1@ezmail.ru
Reply to: