[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: pdftotext



Il 16/05/2015 09:18, Davide Prina ha scritto:
adesso io non ho capito l'esigenza che hai di far salvare i file in ps per poi convertirli in pdf per estrarre testo...
è semplice, quando uno stampa automaticamente classifico il documento andando a leggerne il contenuto e lo archivio in un db.

Ma non è questo il mio problema; mi piacerebbe sapere, se qualcuno ne è a conoscenza, perché il pdf[¹], pur non essendo un'immagine, non sia possibile estrapolarne il testo con i tool disponibili a riga di comando o se qualcuno è a conoscenza di un tool a riga di comando che sia in grado di estrapolarne il testo.

Grazie comunque

Piviul

[¹] https://drive.google.com/file/d/0B45RiL7e2_bcRnVDU1VyRHN1Zlk/view?usp=sharing
Reply to: