[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: pdftotext



Hallo!

Klaus Becker wrote:
>>>ich möchte ein pdf-Datei in Text umwandeln. Mit "pdftotext" (3.0) aus dem
>>>Paket "xpdf-utils" kommen aber nur Hyroglyphen raus.
>>>Kennt sich da jemand aus ?
>>
>>Nicht wirklich. Aber pdftops und anschliessendes ps2ascii bringen bei
>>mir die besten Ergebnisse. Allerdings sind die Umlaute mit der alten
>>Tex-Schreibweise kodiert (mit " davor). pstotext macht es auch nicht
>>viel besser.
>>
>>Gruss,
>>Eduard.
> 
> 
> Hallo Eduard,
> 
> pdftops hat mir die pdf-Datei in eine ordentliche ps-Datei verwandelt. Dann 
> habe ich die ps-Datei mit ps2ascii behandelt, da kommt nur Schrott raus. 
> Welche Option(-en) gibst du da an?
> 
> bye
> Klaus
> 
> 
> 

Ist es vielleicht möglich, dass Deine pdf-Datei den Text als Bild
enthält? Ich hatte auch mal ein Buch, bei dem pdftotext nur Hyroglyphen
ausspuckte. Ich merkte dann, dass in dem Buch nur die Überschriften als
Text hinterlegt waren, nicht aber der eigentliche Text. Probier mal, in
der PDF-Datei nach Wörtern zu suchen. Gegebenfalls dann durch eine
Texterkennung laufen lassen.

Gruß
Alfred



Reply to: