[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Bogofilter



No dia 12/10/2003 às 04:28,
jxz <jxz@uol.com.br> escreveu:

> O bogofilter, bem como qualquer outro filtro estatistico (spamprobe,
> spambayes, bayes do SpamAssassin, ifile, etc) *precisa* da mensagem
> completa. E isso nao é um problema, e sim uma solucao para um
> problema.

Não entendi  exatamente o que quis  dizer. Você pode passar qualquer  texto ao
filtro bayesiano,  a análise é  feita sobre  as palavras, independente  se ela
pertence ao e-mail ou a um texto de Shakespeare.

Olha o que acontece aqui:

echo "oportunidade" | bogofilter -v
X-Bogosity: Yes, tests=bogofilter, spamicity=0.994208, version=0.15.4

Naturalmente,  quanto mais  informação sobre  a mensagem  eletrônica, maior  a
fidelidade de classificação do filtro. Mas de  forma alguma o texto integral é
imprescindível para a análise.

> É assim que esse tipo de filtro funciona. Para mais detalhes, leia
> http://www.paulgraham.com/spam.html.

Basicamente  ele pega  a  incidência das  palavras  e compara  com  a base  de
dados. Se, de acordo  com uma fórmula particular, a soma  das palavras pesarem
para spam, o texto será declarado spam.


-- 
Douglas Augusto



Reply to: