[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Re: Re : exim,procmail,spamassassin



On Wed, Dec 31, 2003 at 03:08:11PM +0100, Vincent Lefevre wrote:
> > Enfin, je précise aussi qu'il faut aussi apprendre (ou le laisser
> > apprendre) les hams, aka les mails légitimes.
> Que signifie alors le champs autolearn dans "X-Spam-Status:"? Pour
> la plupart des mails, il est à "no". Sinon, il est à "ham" ou à
> "spam" suivant le type du mail. 

Ce que ça signifie naturellement : j'ai appris & enregistré tout seul comme
un grand que ce mail était un spam ou un ham pour la base bayesienne (ou
j'ai rien appris du tout, apres tout le doute est permis).

> Je suppose qu'il faut seulement lui faire apprendre les messages pour 
> lesquels autolearn=no, mais que spamassassin peut aussi se débrouiller 
> sans (mais c'est moins bien).

Pour utiliser tout le filtre bayesian, il y a un apprentissage.
Pour un geek abonné a pleins de ML et qui est recoit pleins de spam (ce qui 
est probablement ton cas), ça va assez vite l'auto-apprentissage.
Sinon (ou si le geek est pressé) il faut utiliser sa-learn pour apprendre
au filtre bayesian comment distinguer les mails.
Si je me souviens bien, Bayes est utilisé des le moment ou plus de 1000
spams et plus de 1000 hams ont été enregistré dans la base, soit par
auto-apprentissage, soit par apprentissage manuel via sa-learn. Savoir s'il
est utilisé c'est facile : une score est donné a tous les mails traités
par SpamAssassin.

Lui faire apprendre les messages non-appris automatiquement (et plus encore, 
corriger les erreurs) permet au filtre bayesian d'augmenter un peu son 
efficacité, mais prends du temps. Car plus il y a de données (correctes), 
plus fiable sera le diagnostic. Une fois l'apprentissage initial réalisé, 
continuer d'améliorer le filtrage bayesian me semble un peu une perte de 
temps (me semble juste, car j'ai de bonnes raisons de penser que ça pourrait 
quand même être bénéficiaire dans certains cas). Moins d'un utilisateur sur 
100 s'y aventure probablement d'ailleurs. En tout cas je connais un site de 
plus de 1100 utilisateurs avec un SA installé en system-wide ou je suis 
quasi-sur que personne ne le fait. 

-- 
       Maxime Ritter         |    French Computer Geek
Mail : mritter@alussinan.org | http://maxime.ritter.eu.org 



Reply to: