[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] parser du html en shell



Le dimanche 12 juillet de l'année 2009, vers 20 heures et 58 minutes, serge@srv0.ath.cx écrivait:
> Le Sunday 12 July 2009 19:36:32 fabrice régnier, vous avez écrit :
> > salut la liste ;)

Bonjour,

> > je cherche à parser la balise <A variables_de_la balise >blabla</A> et à
> > récupérer le contenu blabla.
> > Grep ne fait pas ce que je veux car il me donne toute la ligne où
> > apparait <A>.
> >
> > J'ai bien testé avec awk quelque chose du genre:
> > cat mon_fichier_html | awk awk -F"<A" '{print $1}' mais je ne sais pas
> > comment lui indiquer la fin de la balise </A>
> >
> > Des idées ?
> >
> > merci et a+
> >
> > f.
> Par exemple avec Perl:
> 
> % cat blabla.html | \
> perl -W -e 'while (<>){print "$1\n" if (/<a(.*?)<\/a/oi);};'

Pour ce genre de chose, j'utilise Perl avec TreeBuilder. Mais bon, dans
un script et donc pas en une seule ligne de commande.

En espérant que cela aide.

-- 
Alexandre Delanoë


Reply to: