[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: geroglifici in pdftotext



Il 09/02/2018 21:21, Giuliano Curti ha scritto:
[...]
Non so se può essere d'aiuto, mi sembra cmq che il PDF sia un contenitore multiformato: se il formato è TEXT estrarre il contenuto dovrebbe essere facile (a me capita di farlo con una semplice selezione e copia); se il formato è GRAFICO credo non ci sia verso (non so se nel caso può diventare utile un ocr);
beh, è la prima cosa che ho controllato, si tratta sicuramente di testo ma probabilmente come dice Davide è Unicode...

Piviul


Reply to: