[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [OT] Argument list too long beim kopieren vieler Dateien [OT]



On Thu, Aug 03, 2006 at 05:53:04PM +0200, Christian Frommeyer wrote:
> Am Donnerstag 03 August 2006 17:48 schrieb Peter Wiersig:
> > Du weisst das man Bayes-Filter nicht mit alten Daten fuettern
> > soll?
> 
> Echt nicht? Dann liegen die 60.000 Spam-Mails hier ja völlig
> umsonst rum...

http://spamassassin.apache.org/full/3.0.x/dist/doc/sa-learn.html#effective_training

Zum einen wandelt sich auch Spam relativ haeufig, zum anderen
werden die Jahreszahlen dann zu hoch bewertet.

Ich trainiere meine Filter lieber nur mit aktuellen Daten. Am
effektivsten lernt z.B. POPFile nur wenn dieser Fehler macht. In
den Filter von SA habe ich noch nicht allzutief hineingeschaut,
wuerde aber auf Grund meines Kenntnisstands von Bayes-Filtern die
auto-learn Funktion nicht aktivieren.

Der Grossteil meines Spams wird an anderen Merkmalen als dem Body
klassifiziert und ich erlebe in den letzten Wochen einem Zug der
Spammer die versuchen speziell Bayes Filter zu umgehen. Schon
aufgefallen, das viele Worte in Betreffzeilen einen
Linux/OSS-Software Bezug erhalten?

Peter



Reply to: