Re: PDF aus Images in einzelne Seiten zerlegen + OCR
Hallo Thomas,
> Ich meine mich dran erinnern zu können das man das PDF direkt mit
> convert in ein Multipage TIFF umwandeln kann.
"-adjoin". Das klingt gut. Wenn ich das noch unpaper verklickere und das
Ergebnis nach tesseract pipen kann, bleibt nichts mehr von meinem
Batchscript übrig :-)
Konnte heute nicht weitermachen, vermutlich wieder am Wochenende. Dann
ist auch Ocropus von Google raus, wenn der Termin gehalten wird. Bin
gespannt. Wie auch immer - mein Ergebnis poste ich hier.
Freundliche Grüße,
Christoph
PS: tesseract gibt es auch in einer 1.03 als tgz bei Sourceforge, die
ist bei debian nicht drin.
Reply to: