Jan Torben Heuer wrote: > wir haben eine sehr wilde webpräsenz hir am laufen, spricht kein > tollen CMS, sondern so ein bischen was von allem. Ich hätte gerne ein > skript, dass rekursiv einfach alle seiten unter unserer domain > aufruft und mir eine liste von toten links erstellt. Dabei sollen > bestimme urls ignoriert werden (z.B. links in unserem forum). Kennt > jemand sowas? dürfte doch nicht zu schwer sein, oder? Du könntest etwa `wget --delete-after -m deinewebpraesenz.de` machen und danach das access.log mit grep geschickt nach 404-Fehlern parsen. Das Ausschließen bestimmter Verzeichnisse kann entweder schon im wget- Lauf mit dem "-X"-Parameter erfolgen, oder nachträglich beim Parsen.
Attachment:
pgp_pjc24E2g3.pgp
Description: PGP signature