[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Re: script et lynx...



Aurelien a écrit, lundi 7 février 2005, à 13:57 :
> > Je ne comprends  pas très bien ce  que tu veux pour 3),  visiter le lien
> > interactivement, ou récupérer le contenu ?
>  
> Visiter le lien. Le contenu est plutôt pauvre, et ne m'intéresse pas,
> mais par contre, je dois visiter une page régulièrement.

Bon, juste faire semblant de cliquer sur la page, alors ...

> Je vais essayer ton truc, je n'ai pas tout compris au code, mais je vais
> disséquer un peu tout ça.

 $ lynx -dump - <url.txt | awk '
0,/Références/{next}       # saute tout le contenu, pour voir les liens,
$1 ~ /^[0-9]+\.$/ && $2 ~ /^http:/ && NF==2{      # vérifie la ligne ...
   u[$1]=$2;n++}           # ... et copie dans un hachage u[n°.] = lien.
END{print u[int(++n*rand())"."]}   # Fini, tire au sort le lien du jour.
' | xargs wget -O /dev/null  # Récupère le contenu du lien sans le lire.

Il faut peut-être cliquer sur certains liens(*) seulement, fais alors un
test plus précis sur $2 ; les options HTTP de wget peuvent aussi servir.

(* éviter une image iso, par exemple :).
-- 
Jacques L'helgoualc'h



Reply to: