[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Estrazione di dati da email



Il giorno 09 Apr 2002 01:56:50 +0200
Federico Di Gregorio <fog@initd.org> ha scritto:


> FDG la cosa migliore sarebbe una XSLT che processi l'HTML e produca il TXT
> FDG (quell'html non e` poi cosi' malvagio, dopo tutto). pero` non sono a
> FDG conoscenza di nessuno script che lo faccia.

non sarebbe neanche difficile con wget + lynx recuperare tutto il testo in txt su un unico file in modo da formare una mbox.
il problema principale a mio avviso é in una mbox cosí formata, non ci sono gli header di riferimento, quindi non sarebbe poi possibile mettere le email in ordine di tread.

una soluzione che avevo trovato era con sed:

cat mbox | sed s/Re:\ //g > mbox2

e poi oridinare le email per soggetto. Si perde in ogni caso l'ordine corretto, ma é molto meglio di prima.
qualcuno ha soluzioni migliori?

ciao,
MaX




> FDG > Sarebbe un servizio penso utile a molti, in particolar modo ai nuovi. 
> FDG 
> FDG mmm... perche'? 
> FDG 
> FDG -- 
> FDG Federico Di Gregorio
> FDG Debian GNU/Linux Developer & Italian Press Contact        fog@debian.org
> FDG INIT.D Developer                                           fog@initd.org
> FDG   The devil speaks truth much oftener than he's deemed.
> FDG       He has an ignorant audience. -- Byron (suggested by Alice Fontana)
> FDG 


-- 
Massimo Biffi  LocTeam Barcelona - Spain
Debian/Sid on PowerBook Apple G3 
Home: www.maximumdebian.org


-- 
To UNSUBSCRIBE, email to debian-italian-request@lists.debian.org
with a subject of "unsubscribe". Trouble? Contact listmaster@lists.debian.org



Reply to: