OCR e PDF
Ciao Debian-users
Vengo subito alla domanda:
visto che per scannerizzare devo usare winzoz (non esiste supporto per il
mio scanner, l'unico HP non supportato sigh), e visto che il programma hp
che mi permette di creare i documenti spesso mi va in crash (ma possibile
che non sappiano rilasciare la memoria sotto winzoz, cribbio, hanno delle
gestioni delle risorse veramente terribili, questo mi fa ricorda perché
l'ho abbandonato, e non fosse per lo scanner e i cd del corso di inglese,
winzoz sarebbe già sparito totalmente)...
torniamo a noi,
a questo punto volevo usare lo scanner in winzoz solo per fare una brutale
acquisizione dei miei documenti, salvarli pagina per pagina come
un'immagine, a questo punto una volta passato sotto linux, ho la
possibilità di usare un programma di OCR per trasformarli in un formato
testuale che possa anche poi essere editato e poi inserire diversi di
questi file in un unico file pdf?
il programma hp addiritura fa un lavoro del genere, mantenedo oltrettutto
anche la formattazione della pagina originale, inserendo quindi anche le
evventuali figure, per esempio, se copio una pagina di una rivista, mi
viene la pagina uguale a tutti gli effetti, con il testo inserito in modo
che se uno avesse un programma di editing dei files pdf potrebbe anche
editarlo, volevo sapere se esiste qualcosa del genere anche per Debian
(possibilmente non oltre la testing).
potrei caricare l'immagine scannerizzata con openoffice, ma poi non mi
permette di editarne comunque il testo, anche se caricando diverse pagine
posso poi salvarle in un unico file pdf.
la mia intenzione comunque non è tanto poter modificare il testo, solo che
se il testo non fa parte dell'immagine, il file dovrebbe risultare un po'
più leggero, e le scritte comunque un po' più nitide che se fossero solo
un'immagine...
sarei anche disposto ad inserire le diverse figure nella pagina tradotta con
un OCR, certo che sarebbe uno spreco di tempo, ma se questo mi permettesse
una più facile lettura....
grazie
Byez
--
Gollum1
Tesssssoro... dov'é il mio tessssssoro...
Gollum1 - ICQ#: 54644686 or Gollum1 at work - ICQ#: 77266350
Reply to: