Re: Bogofilter
No dia 12/10/2003 às 04:28,
jxz <jxz@uol.com.br> escreveu:
> O bogofilter, bem como qualquer outro filtro estatistico (spamprobe,
> spambayes, bayes do SpamAssassin, ifile, etc) *precisa* da mensagem
> completa. E isso nao é um problema, e sim uma solucao para um
> problema.
Não entendi exatamente o que quis dizer. Você pode passar qualquer texto ao
filtro bayesiano, a análise é feita sobre as palavras, independente se ela
pertence ao e-mail ou a um texto de Shakespeare.
Olha o que acontece aqui:
echo "oportunidade" | bogofilter -v
X-Bogosity: Yes, tests=bogofilter, spamicity=0.994208, version=0.15.4
Naturalmente, quanto mais informação sobre a mensagem eletrônica, maior a
fidelidade de classificação do filtro. Mas de forma alguma o texto integral é
imprescindível para a análise.
> É assim que esse tipo de filtro funciona. Para mais detalhes, leia
> http://www.paulgraham.com/spam.html.
Basicamente ele pega a incidência das palavras e compara com a base de
dados. Se, de acordo com uma fórmula particular, a soma das palavras pesarem
para spam, o texto será declarado spam.
--
Douglas Augusto
Reply to: