[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Erzeugen von durchsuchbaren PDF Dokumenten



Hallo Michael,

[ML] Michael Windelen schrieb:
Aber in diesem Dokument kann man anschliessend noch nicht nach Text suchen.
Gibt es da auch was unter Linux das diese PDF Dokumente anschliessend
durchsuchbar nach Text macht.

Kann mir bitte jemand einen Hinweis geben.


Arg, sorry, jetzt sehe ich erst JPG bzw. TIF... Das wird schwer. Soweit
ich weiss gibt es keine gute Texterkennung für Linux...
Man muß ja erst mit einer OCR das Bild in Text umwandeln..

Also mit gocr habe ich da schon recht gute Erfahrung gemacht.
Ich schaffe es aus dem tif oder jpg mit gocr zusätzliche eine Datei zu erzeugen, die ich dann wie das jpg nenne und halt txt als Endung verwende.

Aber dann würde ich natürlich gerne das *.jpg mit den *.txt so verheiraten wie man es von den Windows kennt.

Wenn man es mit den bekannten Win Tools macht, kann man nachher mit der Suchfunktion in einem pdf Reader nach einem Text suchen.

Der Abbyfinereader und der Acrobat machen es so wie ich es gerne hätte.

Lieber wäre mir eine commadlinetool unter Linux.
Oder was anderes gleichwertiges unter Linux.

lg

Michael


Reply to: