[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: OCR à documents écrits à la machine à écrire



Le jeudi 18 décembre 2008 18:03, Sever P A a écrit :
| français et le résultat a été désastreux. La chose a pu millorer un peu en
| utilisant le *GOCR*, mais le résultat obtenu a été également 
| inacceptable...
| 
| Pouvez me recommander un outil un peu plus adéquate à cet tâche ?

Je n'ai pas de réponse précise. Désolé. 
Juste un retour d'expérience. Peut-être HS.

Avec des outils non libres, moi non plus je n'ai jamais eu de résultats 
satisfaisants même si les pièces à scanner ne comportaient que les 
cinquante/soixante caractères les plus utilisés de la langue anglaise.

Les résulats les moins mauvais étaient obtenus si l'alignement horizontal 
des lignes à "OCRiser" était le plus horizontal possible par rapport à 
l'alignement du scanner. Le changement de graisse, les séquences avec des 
points ou des virgules était très mal reconnus ainsi que les documents 
ayant un faible contraste.
Bref : totalement inexploitables.

Mes tentatives se sont donc arrêtées mais récemment j'ai rencontré des gens 
qui traitaient des fax. Le traitement consistait à "OCRiser" une zone 
prédéfinie afin de repérer un identifiant précis à partir d'un numéro de 
fax commun. Le texte extrait permettait de rédiger automatiquement un email 
avec le fax en pièce jointe et de le transmettre à son seul destinataire.

Si il est possible d'obtenir un très bon résultat à partir d'une 
reconnaissance sur une petite zone alors peut-être est-ce une voie de 
recherche?

Je serai très intéressé par le résultat de tes futures recherches.

-- 
Cordialement,

Alain Vaugham
--------------------------------------------------------
[PUB] Signature numérique GPG de ce courrier: 0xD26D18BC

Attachment: pgpghtJhJGHb2.pgp
Description: PGP signature


Reply to: