Re: Lister les pages d'un site depuis le web?
Roger Bouteiller a écrit, jeudi 9 février 2006, à 11:01 :
> Bonjour a tous!
bonjour,
> Je me demandais si quelqun aurait il une idee sur la possibilite et le
> moyen, dans une console debian, de lister dans un fichier texte tous les
> liens d'un site?
wget et sed ?
> Non pas d'aspirer le site, juste de faire un listing de tous les liens sur
> ce site la, pour ensuite pouvoir retravailler cette liste.
$ wget -m -b --delete-after http://mon.site
Poursuite à l'arrière plan, pid 3123.
La sortie sera écrite vers « wget-log ».
... et cette sortie n'est pas trop difficile à analyser. Si tu préfères
utiliser Perl, « require HTML::LinkExtor; » peut être utile.
--
Jacques L'helgoualc'h
Reply to: