[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Spammails von Spamarchive.org



Am Di, den 01.06.2004 schrieb Michelle Konzack um 1:23:
> Am 2004-05-31 23:05:39, schrieb Daniel Leidert:
> 
> >ACK. Der Bayes-Filter von SA fängt ja sowieso erst bei 200 angelernten
> >Ham- und der gleiche Menge Spam-Mails an zu arbeiten.
> 
> Interessant, den ich habe spamassassin 2.63 erst lezten Monat 
> installiert, sprich ich verwende ihn seit 3 Wochen und er hat 
> mehr als 3000 SPAM gefiltert. Davon sind 7 kein Spam gewesen 
> die ich mit 'sa-learn --ham' verfüttert habe.

Dann arbeitet der Bayes-Filter noch nicht. Ein
# spamassassin --lint -D
sollte Klarheit schaffen. Wenn in der Spam- oder Ham-Datenbank weniger
als 200 Einträge sind, gibt er eine entsprechende Meldung aus, dass der
Bayes-Filter nicht genutzt wird.

> Seit einer Woche habe ich keinen FP gehabt...

Nur interessahlber. Wofür steht FP?

> Allerdings sind noch rund 70 SPAMS durchgerutscht die ich sofort 
> an 'sa-learn --spam' verfütterte...

Hatte ich auch eine Weile probiert. Das Problem war, dass die Trennung
zwischen Ham und Spam nicht sehr deutlich war. Am Ende habe ich bei 3.5
Spam-Punkten gefiltert. Bei Bogofilter ist die Trennung bei mir deutlich
besser. SA dient nur dazu, dahinter alles abzuräumen.

> Also der SPAM hat sich innerhalb von drei ochen drastisch reduziert...

Möglicherweise arbeiten die Datenbanken für Spam und Ham unabhängig
voneinander. Aber mein Wissensstand ist: SA benötigt für beides 200
Mails, dann beginnt der Bayes-Filter zu arbeiten. Das merkt man dann
auch, wenn man sich etwas mehr Header-Output geben lässt.

> >Bogofilter vor SA hat bei mir zu einer deutlichen Verbesserung des
> >Ergebnisses beigetragen.
> 
> ???  Durchgerutschte Mails kannste direkt an 'sa-learn --spam' 
> verfüttern. Das recht vollständig aus.

Ich weiß. Für mich funktioniert aber die andere Lösung besser. Und wie
schon angemerkt wurde, ist Bogofilter deutlich angenehmer für die
Systemresourcen.

MfG Daniel

Attachment: signature.asc
Description: Dies ist ein digital signierter Nachrichtenteil


Reply to: