[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: http 404 error checker



Jan Torben Heuer wrote:
> wir haben eine sehr wilde webpräsenz hir am laufen, spricht kein
> tollen CMS, sondern so ein bischen was von allem. Ich hätte gerne ein
> skript, dass rekursiv einfach alle seiten unter unserer domain
> aufruft und mir eine liste von toten links erstellt. Dabei sollen
> bestimme urls ignoriert werden (z.B. links in unserem forum). Kennt
> jemand sowas? dürfte doch nicht zu schwer sein, oder?

Du könntest etwa `wget --delete-after -m deinewebpraesenz.de` machen
und danach das access.log mit grep geschickt nach 404-Fehlern parsen.
Das Ausschließen bestimmter Verzeichnisse kann entweder schon im wget-
Lauf mit dem "-X"-Parameter erfolgen, oder nachträglich beim Parsen.

Attachment: pgp_pjc24E2g3.pgp
Description: PGP signature


Reply to: