[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Hilferuf spamassin will bayes nicht nutzen



* Peter Blancke [04.04.04 19:24]:

> > Hm. Muß es denn POP3 sein?
> 
> Nein. Ist halt so eingerichtet, es haengen da sehr viele Clients
> dran, da moechte man ungerne umstellen.

Du wirst doch aber nicht gleich nach /dev/null filtern wollen. Damit die
User eventuelle false positives noch sehen können, brauchst Du eh einen
serverbasierten Ordner, in dem Spamverdacht erst einmal landet. Ob Du
nun Webmail einrichtest oder IMAP, irgendwie müssen die Leute
herankommen. Oder wolltest Du ausschließlich taggen lassen, damit
clientbasiert gefiltert wird?

> Das Problem ist dabei allerdings, dass Troll-User auf die Idee
> kommen, die Mail von Arbeitskollegen bzw. "sauberen" Mailpartnern
> dort einzustellen bzw.  anderen Bloedsinn zu verzapfen. Das wuerde
> einige Schwierigkeiten heraufbeschwoeren. Und ja, es gibt wirklich
> solche User.

Ich meinte schon einen Ordner pro User. Wer Unsinn treibt, versaut sich
lediglich seine eigene Spamstatistik.

> Da ich selber Dank meiner Usenet-Taetigkeiten geradezu mit Spam
> taeglich zugeschuettet werde, ueberlege ich an einer Loesung, die
> beiden Dateien ~/.spamassassin/bayes_seen und
> ~/.spamassassin/bayes_toks, die von mir gut gepflegt werden, per
> Cronjob auf den User mailerdaemon der zahlreichen Kundenserver zu
> ueberspielen; dieser User dort leert per fetchmail saemtliche
> Postfaehcer und stellt sie lokalen Clients zur Verfuegung.

Die manpage von sa-learn rät ausdrücklich davon ab, die Statistik
einfach so von einem User auf viele zu übertragen. In dem Punkt glaube
ich dem Spamassassin-Team einfach, weil ich vermutlich nicht 1/10 der
Ahnung von Statistik habe wie sie. Spam an aus dem Usenet abgegrabene
Adressen kann sich aber IMHO statistisch sehr unterscheiden von solchem,
der z.B. aus dem bedenkenlosen Eintrag in dubiose Webformulare generiert
wird. Sprich, andere Auch-Usenet-Benutzer sind eventuell zufrieden, bei
anderen schlagen immer noch 50 Spams pro Tag auf. Das kann man nicht
ausschließen.

Vielleicht noch ein Beispiel in umgekehrter Richtung: Ich nutze Ebay
eher selten, für vielleicht acht Transaktionen pro Jahr. Als ich meine
Mail auf lokal umgestellt habe, zog ich mir per isync alle Mails der
letzten drei Monate, um Spamassassin zu füttern. Ebay-Ham war nicht
darunter, und bei der nächsten Versteigerung lag die Bestätigungsmail
gerade mal 0.2 Punkte unter dem Trigger. Nun ist iBäh-Mail wahrlich
mißgestaltet, aber das Beispiel zeigt, daß Du mit dem Übertragen von
Charakteristiken von einem auf andere User eventuell Gefahr läufst,
Erwünschtes wegzufiltern. Was weißt Du, was die für obskur formatierte
Newsletter abonniert haben und auch erhalten wollen.

> Ergaenzend koennte man eine Mailadresse einrichten, an die Kunden
> Spammails per Forward einliefern koennen und welche ich dann -- nach
> Durchsicht -- durch sa-learn jage.

Handarbeit, die ausufernd werden könnte. Vielleicht sa-learn lieber
gleich unter der User-ID des Weiterleiters ausführen und so dessen
Statistik füttern. Ich fürchte nur, ob manuell oder automatisch, das
Weiterleiten zerstört wichtige Headerinformationen; der Lernprozeß
dürfte langwierig werden.

Grüße,
kro
-- 
Veteran of the Bermuda Triangle Expeditionary Force 1990-1951
(PGP/GPG 0xCE248A25)



Reply to: