Hallo zusammen, es kommen viele PDFs welche dem Namen nach nicht sortierbar sind, jedoch sind das immer die gleichen PDFs vom gleichen Lieferanten. Diese müssen umständlich aufgemacht werden und händisch sortiert. Was ich benötige ist ein Program welches die PDFs öffnet und anschließend sortiert, die Daten dazu sind immer an der gleichen Stelle in der PDF zu finden. Interessanterweise kann ich sogar mit der Suche in Windows anscheinend die PDFs durchsuchen. Bsp: Name pdf: 182941 Eingegeben in Suche: Name Im Folder wird mir dann die PDF 182941 angezeigt. Das muss sich doch automatisieren lassen! Danke Gruß
John D. schrieb: > Das muss sich doch automatisieren lassen Am einfachsten wohl mit einem Toll die PDF in Text umeandeln und dann mit einem Zeichenketten/Dokumentenverarbeitungsprogramm wie AWK die Sortierkriterien extrahieren und sortieren. Oder in Python mit einem PDF Importer. Aber du wirst das, wenn euer Zulieferer auch nur die kleinste Änderung am PDF Format macht, neu programmieren dürfen. Es wird also ein dauernder Quell von Freude.
Was wäre mit Powershell, der einfach die PDFs nacheinander in der "Suche" durchsucht?
Beitrag #5882486 wurde von einem Moderator gelöscht.
Mit pdfgrep kannst du mittels regulärer Ausdrücke nach bestimmten Textstellen in PDFs suchen, ohne die Dateien vorher in ein anderes Format konvertieren zu müssen: https://pdfgrep.org/
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.