[Date Prev][Date Next] [Thread Prev][Thread Next] [Date Index] [Thread Index]

Re: PDF nach OCR-Inhalt umbenennen und in Ordner verschieben



Moin, 

Am Fr., 24. Feb. 2023 um 15:10 Uhr schrieb Tony Blue <tony.blue.mailinglist@gmx.de>:
Hallo,

ich suche nach einer Lösung, die PDF-Dateien nach deren OCR-Inhalts
umbenennt und in Ordner verschiebt.

Also z. B. soll die von der Bank heruntergeladene Datei
"sweriifla[technischer Name].pdf" die im OCR-Inhalt die Bezeichnung
"Kontoauszug Konto 4711 Nr. 5) hat

* umbenannt werden in Kontoauszug 4711 Nr. 5.pdf und

* in den Ordner Kontoauszüge/4711 verschoben werden.

Super wäre wenn dies als Linux-Dienst laufen würde, der ein Verzeichnis
auf neue Dateien überwacht und dann tätig wird. Absolut traumhaft wäre
zusätzlich eine Web-Oberfläche oder GUI auf der man die Regeln zur
Sortierung und Umbenennung einstellen kann.


Bisher habe ich unter Linux hierfür nichts gefunden.


Habt Ihr hier einen Tipp für mich?


Ich habe sowas schon gemacht. Ed gibt nur keine fertig Lösung aber: mit tesseract sollte ein Skript dies in weniger als 20 Zeilen hinbekommen.
Ich hatte das sogar mit einem virtuellen PDF-Drucker zusammen gebaut. Das Drucken hat einfach das Skript getriggert.
Mit freundlichem Gruss
Bjoern  

Reply to: