[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: [Semi OT] aggiungere un indice a file pdf contenenti solo scansioni.



Il giorno dom 12 ott 2014 alle 23:02, Tiziano <tebtiz@alice.it> ha scritto:
Il giorno Sun, 12 Oct 2014 00:29:00 +0200 Federico Bruni <fede@inventati.org> ha scritto:
Il giorno sab 11 ott 2014 alle 20:58, Tiziano <tebtiz@alice.it> ha scritto: > > Un saluto a tutta la lista. > > Mi ritrovo a dover gestire una certa quantità di file pdf ottenuti > da scansioni, se potessi aggiungere degli indici e/o rendere il > testo selezionabile mi sarebbe estremamente comodo. Con "rendere il testo selezionabile" intendi digitalizzare realmente i pdf, ovvero usare un software OCR. Non esistono software perfetti, ma dipende a cosa ti serve. Tempo fa avevo fatto qualche esperimento con tesseract (nei repository). Per indici cosa intendi esattamente?
Con rendere il testo selezionabile intendo che il testo si possa selezionare, copiare ed incollare altrove. Ho visto che la cosa è fattibile ma richiede molto lavoro, mi sarebbe particolarmente utile sopratutto se riuscissi ad ottenere l'altro mio desiderio. Io vorrei avere un indice a lato che mi permetta di accedere direttamente a paragrafi o capitoli contenuti nel pdf. Non capisco quale editor venga usato per fare ciò.

Sì, ti serve un software OCR.

http://en.wikipedia.org/wiki/Tesseract_(software)#Features
http://en.wikipedia.org/wiki/OCRFeeder

Facci sapere come va, magari mi vien voglia di fare una prova anche a me :)


Reply to: