Re: [OT] Wieviel Spam und HAM ist gut für SA?
Torsten Geile schrieb:
Matthias Haegele schrieb:
btw:
Mindestens sind jeweils 200 (verwertbare) Mails erforderlich (Sieht
man im Debug-Log wenn es nicht erreicht ist).
Die bekomme ich wohl zusammen (;-)
Das trainieren mittels sa-learn ist sehr CPU-intensiv und empfiehlt
sich bei einem ausgelasteten Server evtl. in den weniger produktiven
Zeiten (nachts etc.) durchzuführen. Desweiteren bringt es wohl nicht
allzu viel jahrealten Spam zu lernen, da sich Spam ständig wandelt,
also wäre es imho ok, die Spammails der letzten 3- max. 6 Monate zu
lernen.
Bei hammails kann man imho auch ältere Mails an sa-learn verfüttern ...
Das stimmt. CPUlast war zwischen 70-98%. Hatte jetzt mal meine Spams, es
waren ca. 8000 die an mich persönlich adressiert waren, durch SA gejagt.
Hat ca. 30 Minuten gedauert. Hammails waren etwas mehr.
Trotz dieser Maßnahme rutschen noch einige durch. Hatte ich auch nicht
anders erwartet. Habe requiredhits auf 4 runtergestellt, da die
Spammails meist einen Wert von 4 bzw. 4,5 hatten.
Das mit dem relearn ist ne gute Idee. Mal sehen, was in nächster Zeit so
ankommt.
Ein Script dazu habe ich unten angehängt,
das will man unbedingt in einer screen Session starten bei einigen
Hundert Mails dauert es wirklich ewig ...
(Natürlich auch sehr CPU lastig)
Gruß, Torsten
hth
MH
mein spamlearnold.sh:
#!/bin/sh
for f in `ls /var/lib/amavis/virusmails/spam*.gz`; do
echo Lernen der Spam-Mails aus Datei $f ...
gzip -cd $f | sudo -u amavis -H sa-learn --spam --showdots;
done
Reply to: