[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [HS] parser du html en shell



-----BEGIN PGP SIGNED MESSAGE-----
Hash: SHA1

fabrice régnier a écrit :
> salut la liste ;)
> 
> je cherche à parser la balise <A variables_de_la balise >blabla</A> et à
> récupérer le contenu blabla.
> Grep ne fait pas ce que je veux car il me donne toute la ligne où
> apparait <A>.
> 
> J'ai bien testé avec awk quelque chose du genre:
> cat mon_fichier_html | awk awk -F"<A" '{print $1}' mais je ne sais pas
> comment lui indiquer la fin de la balise </A>
> 
> Des idées ?
> 
echo "<A variables_de_la balise >blabla</A>" | sed s/"<[^>]*>"/""/g

Si il y a des espaces ou des tabulations devant :

echo "    	<A variables_de_la balise >blabla</A>" | sed s/"<[^>]*>"/""/g
| sed s/"^[ 	]*"/""/
-----BEGIN PGP SIGNATURE-----
Version: GnuPG v1.4.9 (GNU/Linux)
Comment: Using GnuPG with Mozilla - http://enigmail.mozdev.org

iEYEARECAAYFAkpeujoACgkQ3ygQTLujCrR6JwCfdDoq0wc1uLKj8RikBEHeomag
keoAnR9M++kqdmtf+5nvJUtzaRgY+aKO
=yWvt
-----END PGP SIGNATURE-----


Reply to: