[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Lister les pages d'un site depuis le web?



Jeudi 9 février 2006, 11:35:42 CET, steve a écrit :
> 
> Le Jeudi, 9 Février 2006 11.01, Roger Bouteiller a écrit :
> > Bonjour a tous!
> 
> Bonjour,

'jour,
 
> > Je me demandais si quelqun aurait il une idee sur la possibilite et le
> > moyen, dans une console debian, de lister dans un fichier texte tous
> > les liens d'un site?
> 
> un début de réponse :
> 
> grep "<a href" fichier.html > lesliens.txt
> 
> avec un peu de ménage après.

Marchera pas : le href peut ne pas être sur la même ligne que le <a
Une recherche de "href" seulement serait plus large.

En tout cas, il faut le programmer pour ne rien rater si on veut que cela
soit réutilisable et complet. Un petit script pourrait aller si on est
sûr que les href n'apparaissent pas ailleurs que dans une ancre active
(p.ex. dans un exemple de code ou une partie commentée).

-- 
 Sylvain Sauvage



Reply to: