[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: Erzeugen von durchsuchbaren PDF Dokumenten



Hallo Frank,

Frank Becker schrieb:
Also mit gocr habe ich da schon recht gute Erfahrung gemacht.
Ich schaffe es aus dem tif oder jpg mit gocr zusätzliche eine Datei zu
erzeugen, die ich dann wie das jpg nenne und halt txt als Endung verwende.

Hast du nach einem Howto gearbeitet? Ich hatte gocr mal getestet und es kam durchweg nichts vernünftiges bei heraus. Ist aber auch schon wieder zwei Jahre her. Da kann sich viel getan haben.

Mit welchen Parametern rufst du es auf und welche Scanauflösung verwendest du?

Das kann ich nicht mehr sagen, ist sicher auch schon mehr als 2 Jahre her. Für OCR habe ich selbst mit 300 dpi nahezu immer gute Erfahrung gemacht. Andere Auflösungen führten bisher zu keinen ordentlichen Ergebnissen. Mir ist auch bisher nicht aufgefallen das es bei *.tif oder *.jpg irgendwelche Qualitätsunterschiede beim Erkennen gemacht hätte.

Ich habe auch noch nie von anderen Kollegen gehört das hier mit einer anderen Auflösung als 300 dpi berichtet wurde oder es zu besseren Ergebnissen kam wenn eine andere Auflösung eingestellt wurde.

Aber vielleicht weiss auch hier jemand was anderes zu berichten.

Ich habe schon ganze Bücher in pdf umgewandelt. Mit Abbyfinereader geht das recht gut. Und diese sind auch durchsuchbar.

Ich möchte aber den Vorgang Automatisieren können. Deshalb auch meine Nachforschungen, welche Erfahrungen hier andere gemacht haben.

lg

michael


Reply to: