[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: PDF zu Word mit Hilfe von Cups



Hallo Martin, Hallo alle anderen

Martin schrub am Mon, 4 Jun 2012 18:33:05 +0200:
> ... aus > einem eingescannten Textdokument kann CUPS nicht
> automagisch Absatzinformationen extrahieren usw.

Ein eingescanntes PDF ist nur ein JPEG, dass in ein PDF eingebettet
wurde. Es enthält nicht wie andere PDFs, die z.B. aus einem ODF
generiert wurden, irgendwelche Textinhalte. 
Erkennt man leicht daran, dass man mit jedem halbwegs vernünftigen
PDF-Reader aus letzteren PDFs Text kopieren und woanders
(unformatiert) einfügen kann, aus ersterem geht das nicht.

Für solche Dinge gibt es OCR, gute Programme erkennen auch
Formatierungen mehr oder weniger gut und versuchen, diese im
Ziel-Dateiformat wieder darzustellen.

Ansonsten ist meist neu schreiben die beste Variante - leider.

-- 
LG Maxx


Reply to: