Re: Re: script et lynx...
Aurelien a écrit, lundi 7 février 2005, à 13:57 :
> > Je ne comprends pas très bien ce que tu veux pour 3), visiter le lien
> > interactivement, ou récupérer le contenu ?
>
> Visiter le lien. Le contenu est plutôt pauvre, et ne m'intéresse pas,
> mais par contre, je dois visiter une page régulièrement.
Bon, juste faire semblant de cliquer sur la page, alors ...
> Je vais essayer ton truc, je n'ai pas tout compris au code, mais je vais
> disséquer un peu tout ça.
$ lynx -dump - <url.txt | awk '
0,/Références/{next} # saute tout le contenu, pour voir les liens,
$1 ~ /^[0-9]+\.$/ && $2 ~ /^http:/ && NF==2{ # vérifie la ligne ...
u[$1]=$2;n++} # ... et copie dans un hachage u[n°.] = lien.
END{print u[int(++n*rand())"."]} # Fini, tire au sort le lien du jour.
' | xargs wget -O /dev/null # Récupère le contenu du lien sans le lire.
Il faut peut-être cliquer sur certains liens(*) seulement, fais alors un
test plus précis sur $2 ; les options HTTP de wget peuvent aussi servir.
(* éviter une image iso, par exemple :).
--
Jacques L'helgoualc'h
Reply to: