[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

OCR e PDF



Ciao Debian-users

   Vengo subito alla domanda:
visto che per scannerizzare devo usare winzoz (non esiste supporto per il 
mio scanner, l'unico HP non supportato sigh), e visto che il programma hp 
che mi permette di creare i documenti spesso mi va in crash (ma possibile 
che non sappiano rilasciare la memoria sotto winzoz, cribbio, hanno delle 
gestioni delle risorse veramente terribili, questo mi fa ricorda perché 
l'ho abbandonato, e non fosse per lo scanner e i cd del corso di inglese, 
winzoz sarebbe già sparito totalmente)...

torniamo a noi,

a questo punto volevo usare lo scanner in winzoz solo per fare una brutale 
acquisizione dei miei documenti, salvarli pagina per pagina come 
un'immagine, a questo punto una volta passato sotto linux, ho la 
possibilità di usare un programma di OCR per trasformarli in un formato 
testuale che possa anche poi essere editato e poi inserire diversi di 
questi file in un unico file pdf?

il programma hp addiritura fa un lavoro del genere, mantenedo oltrettutto 
anche la formattazione della pagina originale, inserendo quindi anche le 
evventuali figure, per esempio, se copio una pagina di una rivista, mi 
viene la pagina uguale a tutti gli effetti, con il testo inserito in modo 
che se uno avesse un programma di editing dei files pdf potrebbe anche 
editarlo, volevo sapere se esiste qualcosa del genere anche per Debian 
(possibilmente non oltre la testing).

potrei caricare l'immagine scannerizzata con openoffice, ma poi non mi 
permette di editarne comunque il testo, anche se caricando diverse pagine 
posso poi salvarle in un unico file pdf.

la mia intenzione comunque non è tanto poter modificare il testo, solo che 
se il testo non fa parte dell'immagine, il file dovrebbe risultare un po' 
più leggero, e le scritte comunque un po' più nitide che se fossero solo 
un'immagine...

sarei anche disposto ad inserire le diverse figure nella pagina tradotta con 
un OCR, certo che sarebbe uno spreco di tempo, ma se questo mi permettesse 
una più facile lettura....

grazie
Byez
-- 
Gollum1

Tesssssoro... dov'é il mio tessssssoro...
Gollum1 - ICQ#: 54644686 or Gollum1 at work - ICQ#: 77266350



Reply to: