[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: grab info da paginebianche



fernando Figaroli wrote:

ciao a tutti,
vorrei farmi uno script che... da riga di comando posso interrogare le paginebianche..

sono arrivato fin qui:

wget -q -O/tmp/numtel.tmp --post-data "btt=1&x=6&y=4&nt=$1" http://www.paginebianche.it/pb/numero

mi ritrovo il risultato in /tmp/numtel.tmp...
ora come faccio ad estrarre:

nome
paese
via
Se guardi bene come e' fatto il codice html della pagina ti accorgi subito che la classe dei font utilizzata per mettere il nome e l'indirizzo e' utilizzata solo li' quindi puoi fare una cosa del genere:

per il nome:
cat /tmp/numtel.tmp | grep "font12BluBold\"" | cut -d">" -f2 | cut -d"<" -f1
per l'indirizzo:
cat /tmp/numtel.tmp | grep "font12Blu\"" | cut -d">" -f3 | cut -d"<" -f1

L'unico inconveniente e' che se cambiano qualcosa sul font della pagina (es. il nome del font) ottieni un errore.

Altri approcci non mi vengono in mente :-(

--
Daniele Melosi



Reply to: