[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: from pdf to html



On Fri, 30 Jul 2004 19:53:15 +0200
Dott Giovanni Bonenti <veidt68@interfree.it> wrote:

> Probabilmente è un baco del programma.

Mah, temo piu' che non riconosca l'encoding. Chiedo nella lista di
latex, visto che pare un problema relativo a quel pacchetto.

> al peggio, se i tuo file html non sono molto grossi credo sia
> possibile (con 
> perl o similari) fare una ricerca di regular expressions del tipo "`e"
> e sostiturle con il codice html corretto per la resa della lettera
> accentata.

Si', ho gia' una robetta in Perl che trasforma `e é, anche per antiword
che fa piu' o meno la stessa cosa con le accentate. Dovro' modificarlo
per strippare gli spazi tra l'accento e la vocale, anche se rischio di
fare un casino con gli altri documenti ... nel caso uno scriva 
[puo` essere] diventa [puo éssere] ... :-((

Purtroppo e' tutto "automatico", nel senso che il gran numero di
documenti che devo convertire non mi permette di editare file per file.

Grazie.

-- 

 ,           , 
 /             \ 
((__-^^-,-^^-__))      http://www.frequenze.it
 `-_---' `---_-'      
  `--|o` 'o|--'        Debian Sarge kernel 2.4.22  
     \  `  /           Notebook Asus A2520 CPU 2.4Ghz RAM 512MB
      ): :( 	       			
      :o_o: 		Fare una cazzata: 	mv -R /dev/hda /dev/null
       "-" 		Farla bene: 		dd if=/dev/zero of=/dev/sda

	



Reply to: