[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: web spider



Samuel Tardieu wrote:
> 
> On 13/07, Georges Mariano wrote:
> 
> | le but du jeu : avoir un cron qui détecte (récursivement) les liens
> | incorrects sur nos pages web...
> | wget se plaint systématiquement de pas trouver de index.html, pfff,
> | évidemment je le lance "sur" une page toute faite... ;-)
> 
> linbot ou checkbot
Ok, parfait...
c'est vraiment bien...

petite remarque, avec checbot j'ai régulièrement ce message
(alors même que les pages de rapports sont correctement construites)

Use of uninitialized value in subroutine entry at /usr/bin/checkbot line
720, <CURRENT> line 1.


PS : par curiosité, si quelqu'un sait comment faire vraiment du web
spider avec wget... juste pour savoir.

-- 
# Georges MARIANO              
# INRETS, 20 rue Élisée Reclus 
# 59650 Villeneuve d'Ascq      mailto:georges.mariano@inrets.fr
# FRANCE.                      fax: (33) 03 20 43 83 59   
# http://www3.inrets.fr/estas/mariano/OCamlDebian
# http://www3.inrets.fr/B@INRETS/B-Bibliography



Reply to: