Re: Estrazione di dati da email
Il giorno 09 Apr 2002 01:56:50 +0200
Federico Di Gregorio <fog@initd.org> ha scritto:
> FDG la cosa migliore sarebbe una XSLT che processi l'HTML e produca il TXT
> FDG (quell'html non e` poi cosi' malvagio, dopo tutto). pero` non sono a
> FDG conoscenza di nessuno script che lo faccia.
non sarebbe neanche difficile con wget + lynx recuperare tutto il testo in txt su un unico file in modo da formare una mbox.
il problema principale a mio avviso é in una mbox cosí formata, non ci sono gli header di riferimento, quindi non sarebbe poi possibile mettere le email in ordine di tread.
una soluzione che avevo trovato era con sed:
cat mbox | sed s/Re:\ //g > mbox2
e poi oridinare le email per soggetto. Si perde in ogni caso l'ordine corretto, ma é molto meglio di prima.
qualcuno ha soluzioni migliori?
ciao,
MaX
> FDG > Sarebbe un servizio penso utile a molti, in particolar modo ai nuovi.
> FDG
> FDG mmm... perche'?
> FDG
> FDG --
> FDG Federico Di Gregorio
> FDG Debian GNU/Linux Developer & Italian Press Contact fog@debian.org
> FDG INIT.D Developer fog@initd.org
> FDG The devil speaks truth much oftener than he's deemed.
> FDG He has an ignorant audience. -- Byron (suggested by Alice Fontana)
> FDG
--
Massimo Biffi LocTeam Barcelona - Spain
Debian/Sid on PowerBook Apple G3
Home: www.maximumdebian.org
--
To UNSUBSCRIBE, email to debian-italian-request@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org
Reply to: