from pdf to html
Ciao, ho la necessita' di trasformare alcuni pdf in html. Uso il
pacchetto pdftohtml (version 0.36 http://pdftohtml.sourceforge.net/) che
funziona molto bene con quasi tutti i pdf, tranne quelli prodotti con
latex!! E' indifferente che il file sia stato generato con latex2pdf
oppure facento i passaggi div2ps ps2pdf.
Il problema nell'output del html e' soprattutto relativo alle accentate
che vengono visualizzate come
citt`a (al posto di città)
ma con la particolarita' che l'ultima vocale e' molto distanziata, tipo:
citt` a
Con le stesse opzioni un file scritto in RTF o in DOC, ad esempio, il
cui PDF e' stato creato dalla suite di ADOBE risulta perfetto...
La stringa: ~$ pdftohtml -c -noframes <file>
Cosa posso fare? Purtroppo non posso andare a recuperare il file TEX e
usare latex2html, perche' nel ciclo che uso non ho la minima idea di
dove si trovi il sorgente, anzi non e' proprio detto che lo abbia il
sorgente...
Come fare??
--
, ,
/ \
((__-^^-,-^^-__)) http://www.frequenze.it
`-_---' `---_-'
`--|o` 'o|--' Debian Sarge kernel 2.4.22
\ ` / Notebook Asus A2520 CPU 2.4Ghz RAM 512MB
): :(
:o_o: Fare una cazzata: mv -R /dev/hda /dev/null
"-" Farla bene: dd if=/dev/zero of=/dev/sda
Reply to: