[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Files PDF



Il 06/10/2017 08:33, Piviul ha scritto:
Il 05/10/2017 17:08, peterpunk ha scritto:
On Thu, 05 Oct 2017 16:40:53 +0200 Michele wrote:

Se non è il DRM (che però dovrebbe darti il messaggio relativo)
potrebbe essere che il contenuto proviene da una scansione (ovvero
è solo grafico e non testuale)
Verifica con pdfinfo e/o pdfimages


In questi casi programmi come gimagereader fanno miracoli! ;-)
Ho installato gimagereader; ho creato un pdf da un documento scansionato, l'ho aperto con gimagereader e poi? Sai che non sono riuscito a farci nulla?

Come si fa a trasformarlo in testo?

Piviul


Come ti è stato suggerito, per il riconoscimento, seppur parziale del testo in un'immagine, affidati ad un OCR, il resto, a mio avviso, è aver dimestichezza con  questi strumenti.

Io lo uso poco o nulla, ma dipende molto dalla risoluzione dell'immagine per avere un buon contrasto del testo, perchè sostanzialmente su questo si basa l'OCR.

Più l'immagine è a bassa risoluzione, peggiore è il riconoscimento del testo, e di conseguenza metterci mano leggendo di persona.

--
_|_|_|_|_|_|_|_|_|_
|_|_|_|_|_|_|_|_|_|_|
Simone Girardelli


Reply to: