Re: geroglifici in pdftotext
Il 09/02/2018 21:21, Giuliano Curti ha scritto:
[...]
Non so se può essere d'aiuto, mi sembra cmq che il PDF sia un
contenitore multiformato: se il formato è TEXT estrarre il contenuto
dovrebbe essere facile (a me capita di farlo con una semplice selezione
e copia); se il formato è GRAFICO credo non ci sia verso (non so se nel
caso può diventare utile un ocr);
beh, è la prima cosa che ho controllato, si tratta sicuramente di testo
ma probabilmente come dice Davide è Unicode...
Piviul
Reply to: