[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

from pdf to html



Ciao, ho la necessita' di trasformare alcuni pdf in html. Uso il
pacchetto pdftohtml (version 0.36 http://pdftohtml.sourceforge.net/) che
funziona molto bene con quasi tutti i pdf, tranne quelli prodotti con
latex!! E' indifferente che il file sia stato generato con latex2pdf
oppure facento i passaggi div2ps ps2pdf.

Il problema nell'output del html e' soprattutto relativo alle accentate
che vengono visualizzate come

citt`a (al posto di città)

ma con la particolarita' che l'ultima vocale e' molto distanziata, tipo:

citt`		a 

Con le stesse opzioni un file scritto in RTF o in DOC, ad esempio, il
cui PDF e' stato creato dalla suite di ADOBE risulta perfetto...

La stringa: ~$ pdftohtml -c -noframes <file>

Cosa posso fare? Purtroppo non posso andare a recuperare il file TEX e
usare latex2html, perche' nel ciclo che uso non ho la minima idea di
dove si trovi il sorgente, anzi non e' proprio detto che lo abbia il
sorgente...

Come fare??

-- 

 ,           , 
 /             \ 
((__-^^-,-^^-__))      http://www.frequenze.it
 `-_---' `---_-'      
  `--|o` 'o|--'        Debian Sarge kernel 2.4.22  
     \  `  /           Notebook Asus A2520 CPU 2.4Ghz RAM 512MB
      ): :( 	       			
      :o_o: 		Fare una cazzata: 	mv -R /dev/hda /dev/null
       "-" 		Farla bene: 		dd if=/dev/zero of=/dev/sda

	



Reply to: