[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: archiviazione documenti con ocr per debian?



pero ora ho trovato che tesseract è estremamente migliore di cuneiform
nel riconoscimento del testo senza neanche indicargli in che lingua è
documento.

ciao
MAX



2014-06-21 19:21 GMT+02:00, MaX <maxlinux2000@gmail.com>:
> lo sto provando, ma per ora mi va in crash cuneiform con questi errori:
>
> inizio cuneiform
> Cuneiform for Linux 1.1.0
> inizio hocrpdf
> Warning: tag mismatch: 'b' can not close last open: 'i'
> Warning: tag mismatch: 'span' can not close last open: 'b'
> Warning: tag mismatch: 'p' can not close last open: 'b'
> Warning: tag mismatch: 'i' can not close last open: 'b'
> Warning: tag mismatch: 'span' can not close last open: 'i'
> Warning: tag mismatch: 'p' can not close last open: 'i'
> Warning: tag mismatch: 'div' can not close last open: 'i'
> Warning: tag mismatch: 'body' can not close last open: 'i'
> Warning: tag mismatch: 'html' can not close last open: 'i'
> Warning: unclosed tag: 'i'
> Warning: unclosed tag: 'span'
> Warning: unclosed tag: 'p'
> Warning: unclosed tag: 'b'
> Warning: unclosed tag: 'span'
> Warning: unclosed tag: 'p'
> Warning: unclosed tag: 'div'
> Warning: unclosed tag: 'body'
> Warning: unclosed tag: 'html'
> max@debian:~/Desktop/test-archiviatore$
>
>
> ci sto indagando, cmq se funzionasse, per me sarebbe un ottima
> soluzione... scansiono i documenti con simplescan o qualche cosa del
> genere e li salvo in pdf, poi li do in pasto allo script per renderli
> con il testo inglobato in modo da poter fare una ricerca nel
> filesystem, con find o anche semplicemente locate.
>
> ciao
> MaX
>
> 2014-06-21 16:33 GMT+02:00, Gerlos <gerlosgm@gmail.com>:
>> Il 21/06/2014 11:55, MaX ha scritto:
>>> purtroppo il sito non funziona :(
>>>
>>> http://www.watchocr.com
>>
>> Beh, nel frattempo puoi provare anche questo:
>> http://oscarmanual.org/oscar_emr_12/developers/4.9-utilities/pdfsearch
>>
>> saluti
>> gerlos
>>
>> --
>> "Life is pretty simple: You do some stuff. Most fails. Some works. You do
>> more
>> of what works. If it works big, others quickly copy it. Then you do
>> something
>> else. The trick is the doing something else."
>>             < http://gerlos.altervista.org >
>>   gerlos  +- - - >  gnu/linux registred user #311588
>>
>>
>
>
> --
> ciao,
> MaX
>


-- 
ciao,
MaX


Reply to: