[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Frage an die Procmail-Experten...



Hallo,

kann man eigentlich Variablen auch in den regular expressions verwenden? Bin dabei, Spam nach URLs zu filtern. Zur Zeit sieht das noch so aus:

:0B
* ^[^>]*($|.)*http://.+(com|co\.uk|us|biz|net|info|yahoo\.com|ca|ws|t [vw])($|.)*
{
# einzelne domains
:0B
* http://.*(fallow|firstrate.*|flabby|forall.*|forever.*|fuchsia)\..+
$URL
}
$URL

Die Wahrscheinlichkeit, damit die richtigen URLs zu erwischen, ist schon recht hoch. Gibt es aber in mehreren Zeilen der Mail URLs, wuerde dieses Konstrukt aber nicht nur www.firstrate-stock.com finden, sondern beispielsweise auch www.firstrate-stock.de. Vermutlich waere auch das Spam, insofern waere die Ungenauigkeit vielleicht sogar wuenschenswert. Genauere Ergebnisse koennte man aber erzielen, wenn man allen Domains noch die TLDs mitgaebe:

TLD="(com|co\.uk|us|biz|net|info|yahoo\.com|ca|ws|t[vw])($|.)"

:0B
* http://.*(fallow|firstrate.*|flabby|forall.*|forever.*|fuchsia)$TLD \..+
$URL

Das funktioniert aber nicht; wohl, weil "$" in reg-exes ein Zeilenende markiert. Wie kann man also so etwas realisieren?

Schoenen Gruss,

Andreas



Reply to: