Re: geroglifici in pdftotext
On 09/02/2018 14:45, Piviul wrote:
pdf a cui dovrei estrapolare il testo
contenuto. Con evince lo apro e lo vedo correttamente ma se vado a
selezionare il testo, copiarlo e ad incollarlo in un file di testo si
vedono solo geroglifici.
potrebbe essere che sono stati usati caratteri unicode che sono simili a
quelli alfabetici (alcuni ad occhio sono quasi identici).
Prova a ricercare una parola, nel PDF, che si incolla con geroglifici e
vedi se la trova. Se non la trova probabilmente è questa la spiegazione.
Poi puoi provare ad incollare in un documento che supporta l'unicode e
ha quel font usato nel PDF (es: Libreoffice Writer)
Ciao
Davide
--
Dizionari: http://linguistico.sourceforge.net/wiki
Client di posta: http://www.mozilla.org/products/thunderbird
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook
Reply to: