Re: OCR à documents écrits à la machine à écrire

To: debian-user-french@lists.debian.org
Subject: Re: OCR à documents écrits à la machine à écrire
From: Alexandre <neonoe123321@gmail.com>
Date: Wed, 24 Dec 2008 19:48:10 +0100
Message-id: <[🔎] 20081224184810.GA14507@free.fr>
Mail-followup-to: debian-user-french@lists.debian.org
Reply-to: Alexandre N0-SPAM <neonoespam123321@gmail.com>
In-reply-to: <[🔎] 4950ADC4.6010705@editionsdidier.com>
References: <[🔎] 16af9f420812180903t539373dax857d51b4a1d16978@mail.gmail.com> <[🔎] 20081219001303.ae38bc52.gaetan.perrier@free.fr> <[🔎] 4950ADC4.6010705@editionsdidier.com>

(3ème envoi du même mail... je ne comprends pas que je n'arrive pas à
poster sur la liste...)

Le mardi 23 décembre de l'année 2008, vers 10 heures et 22 minutes,
Daniel Caillibaud écrivait:
> Gaëtan PERRIER a écrit :
>>> [...] je viens de prouver le *tesseract* français et le résultat a
>>> été désastreux. [...]
>>>
>>> Pouvez me recommander un outil un peu plus adéquate à cet tâche ?
>>
>> apt-get install tesseract-ocr
>
> C'est la blague du vendredi où il y a des cas où tesseract fonctionne
> ?
>
 
je viens de tester un document de 3 pages scanné en pdf

convert -density 300 image.pdf image.tif
tesseract image.tif essai -l fra
résultat: près de 1% d'erreurs!

par contre si j'utilise la commande:
convert image.pdf image.tif : 100% d'erreurs

convert -density 150 image.pdf image.tif : 50% d'erreurs
...


Donc tout dépend de la qualité du tif au départ.


-- 
---()()()----()()()----()()()--)()()(----)()()(----)()()(---
-()----()--()-()-----()----()--)(----)(-----)(-)(--)(----)(-
()----()----()()()----()()()----)()()(----)()()(----)(----)(

Reply to:

References:
- OCR à documents écrits à la machine à écrire
  - From: "Sever P A" <gnu.sever@gmail.com>
- Re: OCR à documents écrits à la machine à écrire
  - From: Gaëtan PERRIER <gaetan.perrier@free.fr>
- Re: OCR à documents écrits à la machine à écrire
  - From: Daniel Caillibaud <ml@editionsdidier.com>

Prev by Date: Re: Compatiblité Samsung Q1 et Linux...
Next by Date: Re: Immigration
Previous by thread: Re: OCR à documents écrits à la machine à écrire
Next by thread: recherche application pour générer liste d'anonymat
Index(es):
- Date
- Thread