[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Da html a txt



Ciao InSa,
e un cordiale saluto a tutt i partecipanti alla lista 

On Thu, Dec 07, 2006 at 06:10:32PM +0100, InSa wrote:
> On Thu, 7 Dec 2006 17:11:51 +0100
> Marco Valli <cosmos@riseup.net> wrote:
> 
> > Alle 16:11, giovedì 7 dicembre 2006, InSa ha scritto:
> > > Ovvero: quale programma posso usare per "esportare" i dati dall'html
> > > e farmi un txt "formattato" come voglio io?
> > 
> > html2text
> 
> L'avevo già visto, mi ritrovo con un txt senza tag ma "impaginato". E
> poi giù di sed, ovvero quello che volevo proprio evitare ;)
> 
> Non esiste niente di più semplice?
Usi lynx:

$ lynx nome_file.html <invio>

Poi premi p (print)

e, dalle opzioni standard di stampa, selezioni "Save to local file", premi
invio e, a sinistra ti appare "Enter a Filename": nome_file.txt, dai
invio e ti salva, nella directory corrente, il file di testo senza 
i tag .. pulito pulito .. :-)

oppure direttamente dalla riga di comando:

$ lynx --dump nome_file.html > nome_file.txt <invio>

Buona sperimentazione! .. :-)

Au Revoir
Hugh Hartmann
 

-- 
 ... Linux, Windows Xp ed MS-DOS 
     (anche conosciuti come il Bello, il Brutto ed il Cattivo).   
     -- Matt Welsh

 



Reply to: