[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Spam och Bogofilter



Jag har kört Bogofilter i snart ett år med stor framgång. Något enstaka
mail har då och då felaktigt klassificerats som ham. Inte en enda gång har
ett mail felaktigt klassificerats som spam. Jag får ca 1000 spam i månaden
så jag har ganska många mail att träna Bogofilter med.

För någon månad sedan hände något. Massor av spam slipper igenom.
Uppskattningsvis missar Bogofilter 10-20% av alla spam nu. Har någon annan
upplevt samma sak? Har spammarna hittat på något nytt sätt som lyckas lura
statistiska filter?

Ett väldigt frekvent spam just nu handlar om "powerful weightloss".
Bogofilter klassificerar detta enl:
   X-Bogosity: No, tests=bogofilter, spamicity=0.000000, version=0.91.0

Trots att det innehåller massor av text som borde trigga filtret. Längs
ner ligger dock detta:

***** Start SPAM text *****
---- system information ----
Japan images contents alone invoke could formatting some
all area individual Exchanging W3C culturally Publication yet
writing Group's XML radical-stroke similar-looking problem hidden Task
members publication internationalized tag manner [WSUS] covered Preferences
years display difficult its of Specifying describing imply
***** Slut SPAM-text *****

Det verkar som om spammarna lägger in ett antal "ovanliga spam-ord" för
att lura statistiska filter.

-- 
Mikael Bergman <mb@abc.se>



Reply to: