[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Estrazione di dati da email



Ciao

> Il lun, 2002-04-08 alle 23:59, Ferdinando ha scritto:
> > * lunedì 08 aprile 2002, alle 19:08, Federico Di Gregorio scrive:
> >
> > > nel caso nessuno ti abbia ancora risposto, usa awk. se non sai cos'e'
> > > awk, "info gawk". se ancora non funziona, riscrivi che ti mando un
> > > esempio.
> >
> > Scusami Federico, ma è una curiosità e visto che sei bravo con gli
> > scripts ..........
> >
> > L'archivio della ML Debian è in html, funziona benissimo, però sarebbe
> > pure bello se si potesse scaricare, magari ogni mese in formato mbox.
> > Io ho guardato le "e-mail" create in quella maniera però sono troppo
> > difformi l'una dall'altra, esiste mica uno script - già fatto/si può
> > creare - o, come penso io la "riconversione" è quasi impossibile, a
> > meno di non considerare buona una perdita consistente di dati ?
>
> la cosa migliore sarebbe una XSLT che processi l'HTML e produca il TXT
> (quell'html non e` poi cosi' malvagio, dopo tutto). pero` non sono a
> conoscenza di nessuno script che lo faccia.
Non e' possibile. XSLT richiede un imput ben formato (XML), HTML non lo
e', pensa ad esempio al tag <br>, che in HTML e' regolare, mentre in XML
non lo e'...


Ciao

Linux-anc
(linux-anc@libero.it linux.anc@email.it)
registered as user #170611 with the Linux Counter



--
Prendi GRATIS l'email universale che... risparmia: http://www.email.it/f

Sponsor:
Il simbolo della rete ha compiuto da poco i 450 anni;
Ordina il tuo portafortuna su Airbook.it!
Clicca qui: http://adv.email.it/cgi-bin/foclick.cgi?mid=347&d=9-4  


--
To UNSUBSCRIBE, email to debian-italian-request@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org



Reply to: