Re: [HS ?]spamassassin
On Tue, 4 May 2004 22:58:39 +0200
Florent Bayle <florent.bayle@free.fr> wrote:
> -----BEGIN PGP SIGNED MESSAGE-----
> Hash: SHA1
>
> J'ai configuré kmail pour qu'il filtre les messages entrant avec
> spamassassin. Spamassassin scane bien les message, et en a déjà envoyé
> qq uns à la poubelle, aucun problème de ce côté là. Mon problème vient
> plutôt du fait que je "l'entraîne" avec la commande sa-learn. Je
> voudrais juste savoir si il faut exécuter cette commande en root (spamd
> est lancé en root) ou en utilisateur (je filtre par spamc lancé en tant
> qu'utilisateur). Ensuite, je trouve assez bizarre qu'il ne reconnaisse
> pas comme spam des messages STRICTEMENT IDENTIQUES à des messages que je
> lui ait désigné comme étant du spam. Est-ce normal ? N'est-il pas assez
> entraîné ? Problème de configuration ?
>
1) Les règles de bayes sont fondés sur le calcul suivant. A partir de la
fréquence du mot viagra dans les spams d'une part, du mot viagra en
général et des spams, on obtient
proba(message contenant viagra est un spam)
=
proba(spam contient viagra)*proba(message contient viagra)/proba(spam)
En donnant un message, tu ne fais que modifier les estimateurs des
différentes probabilités (fréquence relative), donc le message n'est pas
forcément reconnu comme un spam la fois suivante. Simplement il a permis
d'ajuster ces estimateurs en les rendant plus proche de la réalité.
Par ailleurs, les règles ne sont valables que si les estimateurs sont
corrects donc au bout de 1000 messages en gros. Les règles ne s'appliquent
qu'à ce moment là.
Il est heureux que spamassassin ne compare pas un message reçu avec tous
les spams précédemment reçu, à coup de 200spams par jour, il n'aurait pas
fini chez moi...
François Boisson
Reply to: