[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: geroglifici in pdftotext



On 09/02/2018 14:45, Piviul wrote:
pdf a cui dovrei estrapolare il testo contenuto. Con evince lo apro e lo vedo correttamente ma se vado a selezionare il testo, copiarlo e ad incollarlo in un file di testo si vedono solo geroglifici.

potrebbe essere che sono stati usati caratteri unicode che sono simili a quelli alfabetici (alcuni ad occhio sono quasi identici).

Prova a ricercare una parola, nel PDF, che si incolla con geroglifici e vedi se la trova. Se non la trova probabilmente è questa la spiegazione.

Poi puoi provare ad incollare in un documento che supporta l'unicode e ha quel font usato nel PDF (es: Libreoffice Writer)

Ciao
Davide

--
Dizionari: http://linguistico.sourceforge.net/wiki
Client di posta: http://www.mozilla.org/products/thunderbird
GNU/Linux User: 302090: http://counter.li.org
Non autorizzo la memorizzazione del mio indirizzo su outlook


Reply to: