[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

web spider



Je cherche un 'web spider' (en paquet debian évidemment), et ben j'en
trouve pas (apt-cache search spider donne rien...)

Y'a bien l'option --spider de wget mais j'arrive pas à en tirer
qqchose...

le but du jeu : avoir un cron qui détecte (récursivement) les liens
incorrects sur nos pages web...
wget se plaint systématiquement de pas trouver de index.html, pfff,
évidemment je le lance "sur" une page toute faite... ;-)

Des idées ??

-- 
# Georges MARIANO              
# INRETS, 20 rue Élisée Reclus 
# 59650 Villeneuve d'Ascq      mailto:georges.mariano@inrets.fr
# FRANCE.                      fax: (33) 03 20 43 83 59   
# http://www3.inrets.fr/estas/mariano/OCamlDebian
# http://www3.inrets.fr/B@INRETS/B-Bibliography



Reply to: