[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: bogofilter



Hallo Dirk,

Dirk Schleicher <dirk.schleicher@gmx.de> wrote:
> Jörg Sommer schrieb:
>  
>> Auch sonst. Dein Skript läuft in keinem eigenen Prozess und hat sein
>> eigenes Arbeitsverzeichnis. Du musst das nicht wieder auf das
>> Anfangsverzeichnis zurückstellen, wenn danach der Prozess beendet wird.
>> 
>> Etwas anderes ist es natürlich, wenn Du das Skript mit „. ./skript.sh“
>> ausführst.
>
> ssh 192.168.182.180 "./spamex" So rufe ich den script auf.

Dann brauchst Du das cd - nicht.

> Wenn ich 
>
> dirk@schnek:~$ ls mail/.unsure/cur
> 1207826863.9866_2.schnek:2,  1207826864.9869_2.schnek:2,
> dirk@schnek:~$ ls mail/.unsure/cur | bogofilter -b -v -t -s
> Can't stat mailstore '1207826863.9866_2.schnek:2,': No such file or directory
> # 0 words, 0 messages

Ahh, stimmt. Mach mal ls mail/.unsure/cur/* | …

>> >> > Doch kommen Mails als Unsure teilweise immer wieder.
>> >> 
>> >> Du solltest auch die Option -u weglassen. Damit versaust Du Dir Deine
>> >> ganze Datenbank. Trainiere nur die E‐Mails, die falsch klassifiziert
>> >> wurden. Nimm einen Stapel gute und schlechte E‐Mails und lasse das Skript
>> >> /usr/share/doc/bogofilter-bdb/examples/contrib/bogominitrain.pl darauf
>> >> los.
>> >
>> > Dann muss ich mal ein wenig Müll sammeln.
>> > Macht es Sinn die als Spamm schon erkannt wurden (wandern bei mir
>> > /dev/null) dafür zu verwenden?
>> 
>> Ja, Du kannst alles nehmen. bogominitrain prüft erst, ob die E‐Mail
>> falsch klassifiziert wird und lernt sie, wenn das der Fall ist.
>> Andernfalls wird die E‐Mail übergangen.
>
> Ich habe den script noch nicht benutzt. Mal sehen wie man den
> benutzt.
> Kann ich denn nicht in meine Mailbaox gehen z.B. .inbox/cur
> und mit la | bogofilter -b -v -t -n diese als ham lernen?
> Dann gehe ich in spam und lasse diese mit -s durchlaufen.

Nein, dann machst Du genau den selben Fehler. Du musst erst prüfen, ob
die Mail falsch erkannt wird und nur in dem Fall trainierst Du
bogofilter.

> Muss man unsure Mails speziell behandeln?

Es in dem Sinn keine unsure Mails. Du sollst hier keine Mails trainieren,
die bogofilter klassifiziert hat, sondern solche, die *Du* klassifiziert
hast. Woher soll denn bogofilter wissen, was ham und spam ist?

> Oder reicht auch hier ein -s aus? Mails die Spam sind aber so nicht
> erkannt worden sind sammele ich in .lernen und lasse dann per Hand ls |
> bogofilter -Ns düber laufen.

> Unsure die aber gut sind kommen in ihre jeweiligen Ordner. Was macht
> es aus, wenn man dann den ganzen Ordner, der schon zum lernen von ham
> hergenommen wurde, wieder mit -Sn durchlaufen lässt. Es werden doch
> nur die unsure als ham erfasst?

Lege Dir zwei Ordner an: als_ham_trainieren und als_spam_trainieren. Wenn
Du Mails bekommst, die bogofilter mit unsure gekennzeichnet hat, dann
kopierst Du die E‐Mail in den entsprechenden Ordner. Wenn bogofilter eine
E‐Mail falsch klassifiziert hat, dann kopierst Du sie ebenfalls in dem
entsprechenden der beiden Ordner, also wenn spam in der inbox geladet
ist, dann kopierst Du den in als_spam_trainieren und wenn eine gute
E‐Mail als Spam erkannt wurde, dann kopierst Du die in
als_ham_trainieren.

Wenn Du Dein Mailprogramm verlässt, rufst Du bogofilter auf:
ls als_ham_trainieren/cur/* | bogofilter -b -v -t -n
rm als_ham_trainieren/cur/*
ls als_spam_trainieren/cur/* | bogofilter -b -v -t -s
rm als_spam_trainieren/cur/*

Damit trainierst Du bogofilter nur noch mit den Mails, die er falsch
klassifiziert hat.

Schöne Grüße, Jörg.
-- 
A red sign on the door of a physics professor: 'If this sign is blue,
you're going too fast.'


Reply to: