[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: filtros bayesianos



On Thu, Jul 26, 2007 at 08:08:14PM -0300, Cristian Mitchell wrote:
> El 26/07/07, Blu <blu@daga.cl> escribió:
> >Nunca he usado SpamAssassin pues me parece una contradicción poner algo
> >escrito en perl en una tarea donde la velocidad es fundamental. He usado
> >bogofilter y CRM114 y ambos me han dado excelentes resultados. CRM114,
> >sobre todo, es increible, aunque hay que saber como entrenarlo para no
> >enseñarle cosas malas.
> 
> con el bogofilter tengo problemas para que me reconosca los mails spam.
> lo uso  con procmail y lo entrene con 8000 mails de spam

Yo uso bogofilter en situaciones donde los mensajes nospam son mas o menos
homogéneos, en ambientes con mensajes heterogeneos prefiero CRM114.

En ambos casos, sin embargo, la forma de entranar al filtro es importante,
pero sobre todo CRM114 suele volverse psicópata si se le entrena en forma
errónea.

El método que uso consiste en entrenar al filtro SÓLO cuando se equivoca.
Es decir, si le llega un spam y lo clasifica correctamente como spam, lo
dejo pasar sin hacer nada. Lo mismo si le llega un ham y lo clasifica
correctamente. Sólo lo entreno cuando la clasificación es incorrecta. 

Por supuesto no se puede esperar que la eficiencia sea de un 100%, pero
con bogofilter alcanzo una tasa de aciertos de entre 96 y 98 por ciento, y
CRM114 suele alcanzar tasas muy por sobre un 99%. Y eso que que no soy
demasiado estricto y prefiero recibir spam a que un mensaje legítimo se
vaya a la basura.

-- 
Blu.



Reply to: