[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Spammails von Spamarchive.org



Am Mo, den 31.05.2004 schrieb Jakob Lell um 21:33:
> On Mon, May 31, 2004 at 07:45:18PM +0200, Thomas Letzner wrote:
> > Hi 
> > 
> > Hab mal ne triviale Frage und zwar soll mein Spamassassin mit SA-Learn seine
> > Trefferquote zu erhöhen. Dazu habe ich ein wenig gegoogelt und bin dabei auf
> > www.spamarchive.org gestoßen, nun habe ich dort heute Nachmittag diverse
> > *.gz Archive gesaugt (insgesamt ~950 MB) 
> 
> Hallo,
> 950 Mb komprimierte Mails sind entpackt einige Gigabyte. Das ist für
> diesen Zweck viel zu viel. Es würde vermutlich Tage dauern, sie alle
> mit sa-learn einzulesen. Für diesen Zweck reichen einige tausend Mails
> völlig aus.

IMHO ist auch das für den Bayes-Filter unnötiger Overkill, wenn
zusätzlich Bogofilter läuft. Razor, Pyzor und DCC helfen, altbekannten
Spam auszusortieren. Werden dann noch passende Config-Variablen für SA
und Bogofilter zum Selbstlernen gesetzt, funktioniert das nach meiner
Erfahrung hervorragend.

>  Ich bekomme mit ca. 600 Mails in meinem Spamordner recht gute
> Ergebnisse. Zusätzlich zu den Spam-Mails braucht man jedoch auch
> normale Mails, damit Spamassassin sie von Spam unterscheiden kann.

ACK. Der Bayes-Filter von SA fängt ja sowieso erst bei 200 angelernten
Ham- und der gleiche Menge Spam-Mails an zu arbeiten.

> > Das zweite wäre die Frage wie ich die gleichen Mails durch Bogofilter laufen
> > lassen kann?

Auf http://www.newbie-net.de/anleitung_imap.html#bogofilter gibt es ein
kleines Skript, das vielleicht eine Anregung ist. Ähnlich könnte man
auch die von Bogofilter aussortierten Mails mit sa-learn an SA
übergeben.

> Wieso willst du 2 Spamfilter verwenden? IMHO ist spamassassin mit
> Bayes alleine ausreichend.

Bogofilter vor SA hat bei mir zu einer deutlichen Verbesserung des
Ergebnisses beigetragen.

MfG Daniel

Attachment: signature.asc
Description: Dies ist ein digital signierter Nachrichtenteil


Reply to: