Re: Da html a txt
Ciao InSa,
e un cordiale saluto a tutt i partecipanti alla lista
On Thu, Dec 07, 2006 at 06:10:32PM +0100, InSa wrote:
> On Thu, 7 Dec 2006 17:11:51 +0100
> Marco Valli <cosmos@riseup.net> wrote:
>
> > Alle 16:11, giovedì 7 dicembre 2006, InSa ha scritto:
> > > Ovvero: quale programma posso usare per "esportare" i dati dall'html
> > > e farmi un txt "formattato" come voglio io?
> >
> > html2text
>
> L'avevo già visto, mi ritrovo con un txt senza tag ma "impaginato". E
> poi giù di sed, ovvero quello che volevo proprio evitare ;)
>
> Non esiste niente di più semplice?
Usi lynx:
$ lynx nome_file.html <invio>
Poi premi p (print)
e, dalle opzioni standard di stampa, selezioni "Save to local file", premi
invio e, a sinistra ti appare "Enter a Filename": nome_file.txt, dai
invio e ti salva, nella directory corrente, il file di testo senza
i tag .. pulito pulito .. :-)
oppure direttamente dalla riga di comando:
$ lynx --dump nome_file.html > nome_file.txt <invio>
Buona sperimentazione! .. :-)
Au Revoir
Hugh Hartmann
--
... Linux, Windows Xp ed MS-DOS
(anche conosciuti come il Bello, il Brutto ed il Cattivo).
-- Matt Welsh
Reply to: