Re: grab info da paginebianche
fernando Figaroli wrote:
ciao a tutti,
vorrei farmi uno script che... da riga di comando posso interrogare le
paginebianche..
sono arrivato fin qui:
wget -q -O/tmp/numtel.tmp --post-data "btt=1&x=6&y=4&nt=$1"
http://www.paginebianche.it/pb/numero
mi ritrovo il risultato in /tmp/numtel.tmp...
ora come faccio ad estrarre:
nome
paese
via
Se guardi bene come e' fatto il codice html della pagina ti accorgi
subito che la classe dei font utilizzata per mettere il nome e
l'indirizzo e' utilizzata solo li' quindi puoi fare una cosa del genere:
per il nome:
cat /tmp/numtel.tmp | grep "font12BluBold\"" | cut -d">" -f2 | cut -d"<" -f1
per l'indirizzo:
cat /tmp/numtel.tmp | grep "font12Blu\"" | cut -d">" -f3 | cut -d"<" -f1
L'unico inconveniente e' che se cambiano qualcosa sul font della pagina
(es. il nome del font) ottieni un errore.
Altri approcci non mi vengono in mente :-(
--
Daniele Melosi
Reply to: