Forum: PC Hard- und Software PDF - Auslesen - Sortieren


von John D. (john_d481)


Lesenswert?

Hallo zusammen,

es kommen viele PDFs welche dem Namen nach nicht sortierbar sind, jedoch 
sind das immer die gleichen PDFs vom gleichen Lieferanten.
Diese müssen umständlich aufgemacht werden und händisch sortiert.

Was ich benötige ist ein Program welches die PDFs öffnet und 
anschließend sortiert, die Daten dazu sind immer an der gleichen Stelle 
in der PDF zu finden.


Interessanterweise kann ich sogar mit der Suche in Windows anscheinend 
die PDFs durchsuchen.

Bsp:
Name pdf: 182941
Eingegeben in Suche: Name

Im Folder wird mir dann die PDF 182941 angezeigt.


Das muss sich doch automatisieren lassen!


Danke Gruß

von Michael B. (laberkopp)


Lesenswert?

John D. schrieb:
> Das muss sich doch automatisieren lassen

Am einfachsten wohl mit einem Toll die PDF in Text umeandeln und dann 
mit einem Zeichenketten/Dokumentenverarbeitungsprogramm wie AWK die 
Sortierkriterien extrahieren und sortieren.

Oder in Python mit einem PDF Importer.

Aber du wirst das, wenn euer Zulieferer auch nur die kleinste Änderung 
am PDF Format macht, neu programmieren dürfen. Es wird also ein 
dauernder Quell von Freude.

von John D. (john_d481)


Lesenswert?

Was wäre mit Powershell, der einfach die PDFs nacheinander in der 
"Suche" durchsucht?

Beitrag #5882486 wurde von einem Moderator gelöscht.
von Yalu X. (yalu) (Moderator)


Lesenswert?

Mit pdfgrep kannst du mittels regulärer Ausdrücke nach bestimmten
Textstellen in PDFs suchen, ohne die Dateien vorher in ein anderes
Format konvertieren zu müssen:

  https://pdfgrep.org/

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.