[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

[HS] HTML, javascript, expression régulière ?



Bonjour la liste,

J'ai besoin de récupérer des adresses mail, j'utilise wget -m http://mon_site_que_j'aime.fr
Je me retrouve avec 5 go de donnée, quand j'ouvre les pages à la mano sous LibreOffice, çà revoie à un javascript:void(0); comme balise pour l'adresse mail.
J'ai donc en ligne de commande taper
$ find . -type f -print | xargs  egrep -o '[a-zA-Z0-9._-]+@[a-zA-Z0-9._-]{2,}\.[a-z]{2,4}'
Voila les erreurs qui apparaissent : 
[...]
grep: paris: No such file or directory
grep: design: No such file or directory
grep: week.pdf: No such file or directory
grep: ./www.____.com/pics/contents/webzine/vs: No such file or directory
grep: a: No such file or directory
grep: glass: No such file or directory

[...]
Je ne récupère que les adresses du Webmestre, donc comment récupérer l'annuaire complet ?
( çà a mouliner toute la nuit et j'ai fait un Control C pour arrêter ce matin )

Donc je sais pas si je n'ai pas télécharger les adresses, ou si c'est l'expression régulière qui est erroné ?

Merci de m’orienter vers un forum plus approprié si vous n'aviez pas la solution !

Ptilou


Reply to: