[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

[OCR] tesseract et tesserocr inopérants



Bonjour,

Du fait que je sois presque aveugle je ne peux pas accéder à un document PDF constitué uniquement d'images.

J'ai obtenu 4 images qui le composent avec :
pdfimages -png article.pdf images
Malheureusement ni tesseract en Bash ni le module tesserocr en Python parviennent à extraire quoi que ce soit (empty).
Elles sont ici :
https://infinityyyy.com/images/

Est-ce  que je m'y prends mal ou un autre OCR libre vsaurait s'en sortir ?

Merci
--
Pierre Estrem


Reply to: