Frage an die Procmail-Experten...
Hallo,
kann man eigentlich Variablen auch in den regular expressions
verwenden? Bin dabei, Spam nach URLs zu filtern. Zur Zeit sieht das
noch so aus:
:0B
* ^[^>]*($|.)*http://.+(com|co\.uk|us|biz|net|info|yahoo\.com|ca|ws|t
[vw])($|.)*
{
# einzelne domains
:0B
* http://.*(fallow|firstrate.*|flabby|forall.*|forever.*|fuchsia)\..+
$URL
}
$URL
Die Wahrscheinlichkeit, damit die richtigen URLs zu erwischen, ist
schon recht hoch. Gibt es aber in mehreren Zeilen der Mail URLs, wuerde
dieses Konstrukt aber nicht nur www.firstrate-stock.com finden, sondern
beispielsweise auch www.firstrate-stock.de. Vermutlich waere auch das
Spam, insofern waere die Ungenauigkeit vielleicht sogar wuenschenswert.
Genauere Ergebnisse koennte man aber erzielen, wenn man allen Domains
noch die TLDs mitgaebe:
TLD="(com|co\.uk|us|biz|net|info|yahoo\.com|ca|ws|t[vw])($|.)"
:0B
* http://.*(fallow|firstrate.*|flabby|forall.*|forever.*|fuchsia)$TLD
\..+
$URL
Das funktioniert aber nicht; wohl, weil "$" in reg-exes ein Zeilenende
markiert. Wie kann man also so etwas realisieren?
Schoenen Gruss,
Andreas
Reply to: