[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Télécopies [était : OCR à documents écrits à la machine à écrire]



Le vendredi 19 décembre 2008 16:09, Jacques L'helgoualc'h a écrit :
| Alain Vaugham a écrit, vendredi 19 décembre 2008, à 03:00 :
| > Bonsoir la liste,
| 
| bonjour,
| 
| > Je cherche un outil qui regarderai le contenu d'un fichier .tiff
| > provenant de Hylafax et qui analyserai son contenu.
| > 
| > Si le contenu est principalement constitué de textes - même en
| > tableaux - cela signifie que c'est peut-être un fax légitime.
| > 
| > Si le contenu est principalement constitué de grandes zones noires ou 
| > blanches avec peu de textes cela signifie que c'est sûrement un fax non 
| > sollicité.
| > 
| > Connaitriez-vous un tel outil qui me permettrait d'améliorer grandement
| > mon système de filtrage sur les faxs indésirables ?
| 
| Faute de trouver un filtre  tout fait, l'histogramme d'un texte noir sur
| blanc doit être assez caractéristique ?

C'est une voie de recherche à l'aquelle je n'avais jamais songé.

| N.B. en essayant « identify », j'ai noté que celui de graphicsmagick est
| /beaucoup/ plus  rapide... Sinon, il  y a aussi  gmic, dont la  ligne de
| commande est un peu rugueuse, mais offre des possibilités de calculs.
| http://gmic.sf.net/

Merci beaucoup,

-- 
Cordialement,

Alain Vaugham
--------------------------------------------------------
[PUB] Signature numérique GPG de ce courrier: 0xD26D18BC

Attachment: pgpsfyyga9LsG.pgp
Description: PGP signature


Reply to: