[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Komandozeilenprogramm zur Nachbearbeitung von OCR



Hallo Horst!

Erst mal Danke an alle für die Antworten…

Horst Felder <bimmelbeule@flohheim.de> schrieb: 
> Ich habe ein Buch gescannt. Nach dem OCR der Scans mit tesseract-ocr
> möchte ich noch automatisch die Zeileumbrüche (LF) entfernen und
> getrennte Wörter zusammenfügen (und natürlich den Trennungsstrich
> entfernen).
[…] 
> Gibt es ein Kommandozeilenprogramm das eine ähnliche Funktionalität
> hat (damit ich es in ein Script packen kann)?

Hätte jetzt nicht gedacht, das ich das Rad neu erfinden müsste… ich
probiere es mal in de.comp.os.unix.shell… vielleicht kennen die
ja ein Script, was die Aufgabe erledigt.

Einen schönen Tag noch! 

-- 
Mit freundlichen Grüßen 
Horst Felder  -  www.h-felder.de 
GNU/Linux; damit ich auch morgen noch vernünftig arbeiten kann!


Reply to: