[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: PDF nach OCR-Inhalt umbenennen und in Ordner verschieben



Am Freitag, dem 24.02.2023 um 16:03 +0100 schrieb Hilmar Preuße:
> On 2/24/23 15:09, Tony Blue wrote:
> 
> Moin,
> 
> > ich suche nach einer Lösung, die PDF-Dateien nach deren OCR-Inhalts
> > umbenennt und in Ordner verschiebt.
> > 
> > Also z. B. soll die von der Bank heruntergeladene Datei
> > "sweriifla[technischer Name].pdf" die im OCR-Inhalt die Bezeichnung
> > "Kontoauszug Konto 4711 Nr. 5) hat
> > 
> Ich hätte erwartet, daß bei Kontoauszügen die Zeichen als Fonts
> enthalten sind, also Verarbeitung mittels OCR gar nicht nötig ist.
> Stattdessen sollte es möglich sein, den Text mittels pdftotext(1) zu
> extrahieren.

Oder im Inhalt suchen mit "pdfgrep".

Gruß,
Michael


Reply to: