[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Bayes für bizzare E-Mail-Adressen ?



Jan Kesten wrote:
Abgesehen davon ist so eine Analyse immer an eine gewisse
Mindestmenge an Text gebunden und die paar Zeichen des Localpart
sind ja nun leider relativ wenig.

Was ist denn mit Trigrammen? Man könnte doch ein Programm schreiben
dass localparts mit Trigrammen die "einfach nicht sein können", wie
z.B. xyc oder pkp bewertet. Ein localpart mit 6 Zeichen könnte da schon
vier Spam-Punkte bekommen. Für Wortenden und kurze Worte kann man ja
auch auf Bigramme ausweichen. Michelles Adresse jvyqfuwzyz hätte da sicher
6-7 Spampunkte bekommen.

--
Mit freundlichen Gruessen
Bjoern Schmidt



Reply to: