[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

spam filter in debian-russian or report on test



Добрый вечер, All,

  Заранее прошу прощения, если мои предыдущие "тесты" кого-то достали.

  Пару недель пробовал посылать сюда письма, но они не попадали в
  лист. Когда мне это надоело, попытался разобраться. Вот выводы к
  которым я пришел.

  Примерно с сентября сообщения в данный лист проходят через
  программу, которая оставляет в заголовке каждого сообщения строки
  вида:
       X-Spam-Status: No, hits=1.1 required=4.0
               tests=SPAM_PHRASE_00_01,USER_AGENT_THEBAT
               version=2.43
       X-Spam-Level: *

  До какого-то времени эта программа для писем подозрительных на спам
  ограничивалась отчетом в заголовке вида:
       X-Spam-Status: Yes, hits=10.8 required=4.7 tests=NO_REAL_NAME,CLICK_BELOW,EXCUSE_3,EXCUSE_7,NORMAL_HTTP_TO_IP,REMOVE_PAGE,A_HREF_TO_REMOVE,FREQ_SPAM_PHRASE,FORGED_YAHOO_RCVD version=2.01
       X-Spam-Flag: YES
       X-Spam-Checker-Version: SpamAssassin 2.01 (devel $Id: SpamAssassin.pm,v 1.61 2002/01/25 04:41:02 jmason Exp $)
       X-Spam-Prev-Content-Type: multipart/alternative; boundary="----=_NextPart_279_48363782368241474081115848"
       X-Spam-Report:   10.81 hits, 4.7 required;
         *  1.2 -- From: does not include a real name
         *  0.0 -- BODY: Asks you to click below
         *  1.0 -- BODY: Claims you can be removed from the list
         *  0.0 -- BODY: Claims you can be removed from the list
         *  1.0 -- BODY: Uses a dotted-decimal IP address in URL
         *  2.3 -- BODY: URL of page called "remove"
         *  1.8 -- BODY: Link to a URL containing "remove"
         *  1.6 -- Contains phrases frequently found in spam
                   [score:  15, hits: absolutely free, cannot]
                   [considered, click here, considered spam, please]
                   [click, removed from, sent compliance, this]
                   [email, you wish]
         *  1.9 -- Forged yahoo.com 'Received:' header found

  Но в определенный момент стало так, что сообщения в X-Spam-Status: Yes
  просто не доходят в рассылку, т.е. включили спам фильтр.

  Это собственно вводная. Проблема заключается в том, что судя по
  всему хинт определения спама "Subject is all capitals" имеет очень
  высокий приоритет, во всяком случае сравнивая:
       Message-ID: <[🔎] 3DDE45C7.6010105@avanto.mpei.ac.ru>
       Subject: python gtk
       X-Spam-Status: No, hits=-0.5 required=4.0
               tests=SPAM_PHRASE_00_01,USER_AGENT,USER_AGENT_MOZILLA_UA,
                     X_ACCEPT_LANG
               version=2.43
               
       Message-ID: <[🔎] 3DDFC137.2050509@ezmail.ru>
       Subject: =?KOI8-R?Q?=D4=C5=D3=D4?=
       X-Spam-Status: No, hits=3.3 required=4.0
               tests=SPAM_PHRASE_00_01,SUBJ_FULL_OF_8BITS,USER_AGENT,
                     USER_AGENT_MOZILLA_UA,X_ACCEPT_LANG
               version=2.43

  видим, что при отличии в успешно пройденных спам тестах только в
  SUBJ_FULL_OF_8BITS разница в хинтах (по которым осуществляется
  предположение спам/не спам) в 3.8, а во втором заголовке всего лишь
  русские буквы, т.е. русские буквы в заголовке почти тождественны
  спаму.

  Плюс к этому неравенство почтовых агентов. Так например письмо
  полностью по содержанию и теме идентичное Message-ID:
  <[🔎] 3DDFC137.2050509@ezmail.ru> (последний фрагмен), но написанное из
  The Bat! не прошло вообще. Письмо отличающееся лишь темой (test) и
  написанное также в The Bat!:
       Message-ID: <[🔎] 6121723446.20021123202135@ezmail.ru>
       Subject: test
       X-Spam-Status: No, hits=1.1 required=4.0
               tests=SPAM_PHRASE_00_01,USER_AGENT_THEBAT
               version=2.43

  получает сразу хинт 1.1 (видимо мышка мордой не вышла).

Резюме

  Конечно есть еще множество факторов, но фокус в том, что с The Bat!
  написать письмо с РУССКОЙ темой в РУССКУЮ рассылку сейчас
  практически не реально.

  ЗЫ листмастеру listmaster@lists.debian.org я написал спросил о том
  возможно ли общение с ним на русском языке. Если он ответит, что
  можно, то я сам с ним переговорю по этому вопросу, но если он может
  общаться только на английском, как впрочем и на любом другом языке
  отличном от русского, я пас. Английский я могу читать со словарем,
  ну часть доков почитать без, но писать на нем я не могу. Тогда
  возможно кому-то другому придется с ним попереписыватся.

--
Всего наилучшего,
 Anseis                            mailto:anseis1@ezmail.ru



Reply to: