Re: täglicher ht://dig-Lauf scheitert an 2 PDF-Dateien

To: debian-user-german@lists.debian.org
Subject: Re: täglicher ht://dig-Lauf scheitert an 2 PDF-Dateien
From: Eberhard Spittler <ebsp---2@bayern-mail.de>
Date: Thu, 24 Jul 2003 07:09:05 +0200
Message-id: <3F1F69F1.2040205@bayern-mail.de>
References: <3F1EC121.7070906@bayern-mail.de> <20030723180401.GC20230@linau.de>

Christian Schmidt schrieb:

Keine Angst: Das ist nur ein Konfigurationsfehler. Auf unserem
Webserver an der Uni konnten wir diesen beheben, indem wir xpdf
installierten und htdig anwiesen, PDF-Dateien damit zu parsen.


Hallo Christian,

also schlicht einen anderen Parser genommen?

Bei meinem privaten Archiv hatte ich auch schon mit den beiden Parsernexperimentiert und festgestellt, daß der eine von beiden mehr (einenprozentual höheren Anteil) von PDF-Dokumenten erkennt, während derandere den Text auf "zusammenhängendere" Art und Weise herauszieht.

PDF scheint doch sehr komplex und vielfältig zu sein. Das merkt man jaschon, wenn man mit einem alten AcrobatReader an ein neues Dokumentgeht: was einem da an Color Spaces und anderen Sachen als Fehler um dieOhren gehauen wird!



Erst mal vielen Dank!
Eberhard

Reply to:

Follow-Ups:
- Re: täglicher ht://dig-Lauf scheitert an 2 PDF-Dateien
  - From: Christian Schmidt <christian.schmidt@chemie.uni-hamburg.de>

References:
- täglicher ht://dig-Lauf scheitert an 2 PDF-Dateien
  - From: Eberhard Spittler <ebsp---2@bayern-mail.de>
- Re: täglicher ht://dig-Lauf scheitert an 2 PDF-Dateien
  - From: Christian Schmidt <christian.schmidt@chemie.uni-hamburg.de>

Prev by Date: Re: Wo sind meine Daten?
Next by Date: Re: Zugriffsrechte für Homeverzeichnis durchdefault voreinstellen
Previous by thread: Re: täglicher ht://dig-Lauf scheitert an 2 PDF-Dateien
Next by thread: Re: täglicher ht://dig-Lauf scheitert an 2 PDF-Dateien
Index(es):
- Date
- Thread