[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: filtros bayesianos



Christian Pinedo Zamalloa escreveu:
hola,

mi experiencia con los filtros bayesianos de SpamAssassin es un
desastre. Al utilizalo suelo tener un comportamiento peor que cuando no
los utilizo. Esto me hace plantearme que seguramente este haciendo algo
mal.

Me he creado una tarea de cron que una vez a la semana ejecuta el
siguiente script:

#!/bin/sh
sa-learn --no-sync --spam /home/i2t/jtbpizac/Maildir/.Junkmail/cur
sa-learn --no-sync --ham /home/i2t/jtbpizac/Maildir/cur
sa-learn --no-sync --ham /home/i2t/jtbpizac/Maildir/.lists.*/cur
sa-learn --no-sync --ham /home/i2t/jtbpizac/Maildir/.projects.*/cur
sa-learn --sync

Tengo la carpeta con spam en (Maildir/.Junkmail/cur) y el resto son carpetas
con email personales (Maildir/cur) listas de correo (Maildir/.lists.*/cur) y
proyectos (Maildir/.projects.*/cur). En general tengo mucho más emails
ham que emails spam.

Pues con estas reglas de sa-learn que se ejecutan cada semana los
mensajes típicos de spam que llegan periodicamente identicos obtienen un
BAYES_00=-2.599. Curiosamente este valor, el mismo valor, se repite en
la mayor parte de mis emails de spam cuando entiendo que no debería ser
tan habitualmente el mismo y menos que fuese negativo sino positivo.o

El valor de BAYES_00 de mis mensajes personales que no son spam tambien
habitualmente es -2.599.
¿Algo que haga mal? Muchas gracias,


Como los matemáticos apuestan al trabajo de los suyos... usamos filtros bayesianos y estamos contentos con ellos.

Fue instalado Amavis+SpamAssassin y detecta más de 90% del spam que recebemos.

Lo que me acuerdo de haber leído en la documentación de SpamAssassin era para NO entrenarlo con correo de listas de correos. Eso sí lo confundía. Además hay que tratar de siempre mantener un equilibrio entre la cantidad de spam y ham que se usa para entrenar el filtro. Otra observación es que no sirve de nada entrenarlo con 10.000 mensajes de cada categoría.

Bueno... suerte!!!

Saludos.

--
Miguel Da Silva
Administrador de Red
Centro de Matemática - http://www.cmat.edu.uy
Facultad de Ciencias - http://www.fcien.edu.uy
Universidad de la República - http://www.rau.edu.uy



Reply to: