Forum: PC Hard- und Software PDF - Auslesen - Sortieren

von John D. (john_d481)

21.06.2019 09:26

Lesenswert?

•

Hallo zusammen,

es kommen viele PDFs welche dem Namen nach nicht sortierbar sind, jedoch 
sind das immer die gleichen PDFs vom gleichen Lieferanten.
Diese müssen umständlich aufgemacht werden und händisch sortiert.

Was ich benötige ist ein Program welches die PDFs öffnet und 
anschließend sortiert, die Daten dazu sind immer an der gleichen Stelle 
in der PDF zu finden.


Interessanterweise kann ich sogar mit der Suche in Windows anscheinend 
die PDFs durchsuchen.

Bsp:
Name pdf: 182941
Eingegeben in Suche: Name

Im Folder wird mir dann die PDF 182941 angezeigt.


Das muss sich doch automatisieren lassen!


Danke Gruß

Beitrag melden Bearbeiten Thread verschieben Thread sperren Anmeldepflicht aktivieren Anpinnen Thread löschen Thread mit anderem zusammenführen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PDF - Auslesen - Sortieren

von Michael B. (laberkopp)

21.06.2019 09:42

Lesenswert?

•

▲
▼

John D. schrieb:
> Das muss sich doch automatisieren lassen

Am einfachsten wohl mit einem Toll die PDF in Text umeandeln und dann 
mit einem Zeichenketten/Dokumentenverarbeitungsprogramm wie AWK die 
Sortierkriterien extrahieren und sortieren.

Oder in Python mit einem PDF Importer.

Aber du wirst das, wenn euer Zulieferer auch nur die kleinste Änderung 
am PDF Format macht, neu programmieren dürfen. Es wird also ein 
dauernder Quell von Freude.

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Re: PDF - Auslesen - Sortieren

von John D. (john_d481)

21.06.2019 10:02

Lesenswert?

•

▲
▼

Was wäre mit Powershell, der einfach die PDFs nacheinander in der 
"Suche" durchsucht?

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Beitrag #5882486 wurde von einem Moderator gelöscht.

Re: PDF - Auslesen - Sortieren

von Yalu X. (yalu) (Moderator)

21.06.2019 11:58

Lesenswert?

•

▲
▼

Mit pdfgrep kannst du mittels regulärer Ausdrücke nach bestimmten
Textstellen in PDFs suchen, ohne die Dateien vorher in ein anderes
Format konvertieren zu müssen:

  https://pdfgrep.org/

Beitrag melden Bearbeiten Löschen Markierten Text zitieren Antwort Antwort mit Zitat

Thread beobachten |

Seitenaufteilung abschalten

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.

Bestehender Account

Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen

Noch kein Account? Hier anmelden.

Kontakt/Impressum – Datenschutzerklärung – Nutzungsbedingungen – Werbung auf Mikrocontroller.net