Am 2004-09-12 07:26:52, schrieb S. Kremer: > Hi > Ich habe nun versucht mit > > sa-learn --spam --mbox /var/mail/<mailbox> und > sa-learn --ham --mbox /var/mail/<mailbox> > > die DB zu füttern, aber scheinbar reichen meine Mails noch nicht aus. > Ausserdem habe ich gemerkt, dass sa-learn wieder alle EMails > durchforstet, obwohl im Mailverzeichnis keine neuen Mails hinzugekommen Er durchforstet immer alle Messages, danach steht aber: Learned from 37 message(s) (1209 message(s) read) (Das habe ich diesen Monat bekommen) > Ich habe im Zuge meiner Suche auf einer Seite gelesen, dass für das > Training der Bayes-DB zwei Ornder angelegt wurden, einmal für HAM und > einmal für SPAM, per Skript wurden die beiden Ordner dann einmal täglich > durchforstet und damit die DB gefüttert. Nööö, wenn Du mel ne Debian-mailbox mauell bereinigt und die SPAM's in einen seperaten Folder verschoben hast, setze sa-learn auf die Debian-Mailbox mit "--ham" an Ich habe das mit allen manuell gesäuberten Mailfoldern gemacht und SA mit 30.000 Messages --ham und rund 10.000 Messages --spam gefüttert. > Welche Möglichkeit habe ich denn, die Bayes DB rel. schnell mit HAM und > SPAM Einträgen zu füllen, damit die auto_learn Option aktiviert wird? > Gibt es da einen besonderen Trick oder ein paar gute Tipps? s.o. Bei den lezten rund 700.000 SPAMS habe ich kein einziges FP... Habe die mails in meine postgresql importiert und analysiert, von wo die alle herkommen und über welche Mailingliste ich sie bekommen habe... Somit kann ich in procmail meine "whitelist" für exim.org, mutt.org, postgresql.org und php.net sowie isc.org verwenden und spare mir das filtern mit SA. > Gruss > Stefan Greetings Michelle -- Linux-User #280138 with the Linux Counter, http://counter.li.org/ Michelle Konzack Apt. 917 ICQ #328449886 50, rue de Soultz MSM LinuxMichi 0033/3/88452356 67100 Strasbourg/France IRC #Debian (irc.icq.com)
Attachment:
signature.pgp
Description: Digital signature