[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Estrazione di dati da email



Lo'oRiS il Kabukimono wrote:

perche' e' html sbagliato. se segue il dtd il problema non sussiste.


e pure in questo caso, lo si potrebbe filtrare attraverso tidyhtml,
dicono che faccia un buon lavoro.

confermo!!! tidy fa un buon lavoro..... riesce a "recuperare" html orrendo (ha pure l'opzione per quello fatto da word)
e gli puoi fare fare quasi di tutto....

togliendo un po di opzioni (quelle dei warnig lo può usare come filtro trasparente..... oltre alle opzioni di base ce ne sono un sacco che puoi attivare e disattivare (ad esempio se correggere le url o meno) dentro il file di conf prima di compilarlo.... io lo uso come una specie di proxy dentro un cgi e non ho mai usato problemi:PPP



ciao






--
To UNSUBSCRIBE, email to debian-italian-request@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org



Reply to: