[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: pdf: Text mit mehreren Kolonnen extrahieren



Hallo,

geht es allgemein darum, Tabellen einzulesen oder um eine spezielle (Art von) 
PDF? Im letzten Fall wäre es evtl. hilfreich, eine Test-PDF zu haben.

Manchmal kann man den Output von solchen Kopien (oder auch pdftotext wie 
Martin geschrieben hat) mittels sed/awk/... aufarbeiten, so dass was 
sinnvolles raus kommt.

Christian

vom Monday 24 June 2013 17:13:11:
> Hallo Leute,
> 
> mit pdftotext oder Dolphin lassen sich pdf-Dateien mit mehreren Kolonnen
> nicht brauchbar extrahieren, da sich die Kolonnen vermischen.
> 
> Gibt es eine Lösung dafür?
> 
> Gruss
> 
> Klaus

Attachment: signature.asc
Description: This is a digitally signed message part.


Reply to: