Hallo,
ich suche nach einer Lösung, die PDF-Dateien nach deren OCR-Inhalts
umbenennt und in Ordner verschiebt.
Also z. B. soll die von der Bank heruntergeladene Datei
"sweriifla[technischer Name].pdf" die im OCR-Inhalt die Bezeichnung
"Kontoauszug Konto 4711 Nr. 5) hat
* umbenannt werden in Kontoauszug 4711 Nr. 5.pdf und
* in den Ordner Kontoauszüge/4711 verschoben werden.
Super wäre wenn dies als Linux-Dienst laufen würde, der ein Verzeichnis
auf neue Dateien überwacht und dann tätig wird. Absolut traumhaft wäre
zusätzlich eine Web-Oberfläche oder GUI auf der man die Regeln zur
Sortierung und Umbenennung einstellen kann.
Bisher habe ich unter Linux hierfür nichts gefunden.
Habt Ihr hier einen Tipp für mich?
Ich habe sowas schon gemacht. Ed gibt nur keine fertig Lösung aber: mit tesseract sollte ein Skript dies in weniger als 20 Zeilen hinbekommen.