[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] HTML, javascript, expression régulière ?



Enfin une question à laquelle je peux essayer de répondre :-)

Je suis nul en informatique, mais j’ai une relative maîtrise des expressions 
rationnelles.
Dans ton expression, tu as oublié de protéger le point et le trait d’union. 
Par ailleurs, on peut faire plus simple en utilsant \w.

Essaie :
[\w\.\-]+@[\w\.\-]{2,}\.[a-z]{2,4}

Cela dit, il faut aussi parfois protéger les contre-obliques, en tout cas dans 
sed. Le plus « drôle », c’est que cela dépend aussi du shell utilisé. 

Thomas Savary
Le Grand Plessis
F-85340 L’Île-d’Olonne
Tél. 06 22 82 61 34
www.correctionpro.fr
www.compo85.fr

Lundi 23 octobre 2017, à 01:19:46 CEST, ptilou a écrit :
> Bonjour la liste,
> 
> J'ai besoin de récupérer des adresses mail, j'utilise wget -m
> http://mon_site_que_j'aime.fr Je me retrouve avec 5 go de donnée, quand
> j'ouvre les pages à la mano sous LibreOffice, çà revoie à un
> javascript:void(0); comme balise pour l'adresse mail. J'ai donc en ligne de
> commande taper
> $ find . -type f -print | xargs  egrep -o
> '[a-zA-Z0-9._-]+@[a-zA-Z0-9._-]{2,}\.[a-z]{2,4}' Voila les erreurs qui
> apparaissent :
> [...]
> grep: paris: No such file or directory
> grep: design: No such file or directory
> grep: week.pdf: No such file or directory
> grep: ./www.____.com/pics/contents/webzine/vs: No such file or directory
> grep: a: No such file or directory
> grep: glass: No such file or directory
> 
> [...]
> Je ne récupère que les adresses du Webmestre, donc comment récupérer
> l'annuaire complet ? ( çà a mouliner toute la nuit et j'ai fait un Control
> C pour arrêter ce matin )
> 
> Donc je sais pas si je n'ai pas télécharger les adresses, ou si c'est
> l'expression régulière qui est erroné ?
> 
> Merci de m’orienter vers un forum plus approprié si vous n'aviez pas la
> solution !
> 
> Ptilou



Reply to: