Re: [OT] Fragebogen: Wie von Papier nach Daten umwandeln
Hallo!
In der Zeitschrift Linux User 8/2014 gab es einen Artikel über OCR unter
Linux:
"Der Traum ist so alt wie der PC auf dem Schreibtisch: Im papierlosen Büro
sollen Akten nur noch digital im Rechner vorliegen. Für das Verwalten des
totholzfreien Büros wurde Paperwork entwickelt. Karsten Günther" ; "Paperwork
ist ein neuer Versuch, das papierlose Büro umzusetzen, der ausschließlich auf
freie Software-Komponenten setzt. Inwieweit das funktioniert, verrät dieser
Artikel."; "Paperwork basiert im Wesentlichen auf vier Komponenten: Zum
Scannen der Unterlagen greift Paperwork auf Sane zurück. Die Texterkennung
übernehmen Tesseract oder Cuneiform. Whoosh û indiziert die per OCR
umgewandelten Texte, sodass sie sich gut durchsuchen lassen, zudem generiert
das Werkzeug automatisch Vorschläge für Schlüsselwörter. Das Ganze fasst
Paperwork dann in einer mit GTK/Glade entwickelten grafischen Oberfläche
zusammen."; Bietet u.a. eine grafische Oberfläche für die zwei OCR-Maschinen;
Viele Hinweise auf Programme fürs Scannen, Indexieren und Umwandeln von
Schriftstücken
Hier kann das Heft bezogen werden:
http://shop.linux-magazin.de/zeitschriften/linuxuser/einzelhefte/eh10267.html
Tschüß,
Volker
Reply to: