[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Spammails von Spamarchive.org



On Mon, May 31, 2004 at 07:45:18PM +0200, Thomas Letzner wrote:
> Hi 
> 
> Hab mal ne triviale Frage und zwar soll mein Spamassassin mit SA-Learn seine
> Trefferquote zu erhöhen. Dazu habe ich ein wenig gegoogelt und bin dabei auf
> www.spamarchive.org gestoßen, nun habe ich dort heute Nachmittag diverse
> *.gz Archive gesaugt (insgesamt ~950 MB) 

Hallo,
950 Mb komprimierte Mails sind entpackt einige Gigabyte. Das ist für
diesen Zweck viel zu viel. Es würde vermutlich Tage dauern, sie alle
mit sa-learn einzulesen. Für diesen Zweck reichen einige tausend Mails
völlig aus. Ich bekomme mit ca. 600 Mails in meinem Spamordner recht gute
Ergebnisse. Zusätzlich zu den Spam-Mails braucht man jedoch auch
normale Mails, damit Spamassassin sie von Spam unterscheiden kann.

> leider habe ich keinen blassen
> schimmer ob es sich dabei nun um das mbox-Format oder um ein Maildir-Format
> handelt. Dazu bräuchte ich eure Hilfe. 

Die Daten sind im mbox-format.

> Und zweitens läuft bei mir Cyrus als
> IMAP Server mit welchem Format arbeitet der standardmäßig? 

Cyrus speichert die Mails in einer internen Datenbank. Das ist weder
Mbox noch Maildir.
> 
> Das zweite wäre die Frage wie ich die gleichen Mails durch Bogofilter laufen
> lassen kann?

Wieso willst du 2 Spamfilter verwenden? IMHO ist spamassassin mit
Bayes alleine ausreichend.

Jakob
> 
> Thanx 
> Thomas
> 
> 



Reply to: