[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: PDF zu Word mit Hilfe von Cups



Hallo Michael, Hallo alle anderen

Michael schrub am Wed, 6 Jun 2012 19:20:39 +0200:
> Maxx schrieb:
> 
> > Wenn es aber z.B. ein Scan-PDF ist, hat man eigentlich kaum eine
> > andere vernünftige Chance. OCR ist erst effektiv, wenn man es an
> > einen Dokumententyp (Schrift, Sprache, Formatierung) anpasst - und
> > das lohnt zumindest bei Einzelfällen in der Regel nicht.
> 
> In diesen Einzelfällen importiert man den/das Scan/PDF und editiert
> den Text im Overlay. Das kann im Zweifel z.B. jedes DTP-Programm. Im
> letztem Jahrtausend wurden hier so reihenweise eingescannte
> Formulare automatisiert ausgefüllt.

Wenn es nur um ein Formular geht - kein Problem. Aber hier ging es um
Vertragstexte, die noch angepasst werden sollten. Und da sieht es
nicht unbedingt sehr professionell aus, wenn da die editierten
Stellen doch in der Regel sichtbar sind. 
Oder man betreibt entsprechenden Aufwand, um Schriftart, -größe und
-schnitt dem Original anzupassen - womit das Abtippen wohl doch
wieder sinnvoll sein kann.

OCR kann eine Alternative sein, wenn es sich um eine sehr
einheitliche Vorlage mit einer gut zu erkennenden Schriftart handelt.
Inzwischen arbeiten die guten OCR-Programme auch mit Grammatik- und
Rechtschreibmodulen zusammen, um eine relativ gute Trefferquote zu
erreichen.

Und wenn das PDF direkt aus einer Textverarbeitung generiert wurde,
das Original aber nicht mehr vorhanden ist, reicht pdf2txt aus :)

-- 
LG Maxx


Reply to: