Hallo liebe Gemeinde, ich suche grob unter dem Thema OCR genau das Gegenteil ;-) Ich habe Formulare mit aufgeklebten Passfotos, die ich extrahieren und weiterverarbeiten muss. Kann man da auch mit tesseract o.ä. arbeiten ? Die Formulare könnten auch nochmal angepasst werden , z.B. mit speziellen Markern ums Bildfeld, sodass die Software das besser finden kann. Derzeit muss das alles von Hand gecroppt werden und macht sauviel Arbeit. Beitrag "Re: Bilderkennung von Daten in bildern" ginge das damit evtl. ? Es geht um Nicht-kommerzielle Nutzung im Bildungsbereich, die Formulare werden von Hiwis eingescannt, die liegen manchmal nicht gerade auf dem Scanner oder die Passfotos sind schepp aufgeklebt etc. Die weitere Verarbeitung würde ich vermutlich für eine Gesichtserkennung nochmal über opencv laufen lassen. LG & THX
Mit etwas selbstgeschriebener Software sollte sich das Cropping auf 2 Mausclicks (für exakt gerade aufgeklebte Bilder), schlimmstenfalls auf 3 Klicks (mit schief-aufgeklebt-Ausgleich) reduzieren lassen. Den Dateinamen könnte man per OCR aus einem Bereich der Vorlage mit Name (und evtl. zusätlich dem Feld mit Geburtsdatum für Gleichnamige) erledigen lassen. Kommt darauf an, ob sich der Aufwand (ca. 6..8h für einen erfahrenen Programmierer) aufgrund der Masse der Vorlagen lohnt ...
Wenn du später sowieso OpenCV dahinterhängen willst, lass doch OpenCV auch gleich den Bildausschnitt suchen. z.B. per Histogram den "buntesten"/"dunkelsten" Bereich im Scan suchen. Evtl. etwas vorverarbeiten (Grayscale, leichter GaussianBlur), dann Linien(Contour)-Erkennung über den Bereich (opencv -> Features2d). Aus dem Linien-Wust die Bounding Box für das Passbild rausrechnen (das ist etwas tricky... evtl: findContours, approxPolyDP, convexHull/isContourConvex, nach Fläche und Umfang filtern ...) so bestimmten Bildausschnitt (aus originalbild) rotieren/skalieren (getAffineTransform, warpAffine, ...) und wegspeichern.
Frank E. schrieb: > Den > Dateinamen könnte man per OCR aus einem Bereich der Vorlage mit Name > (und evtl. zusätlich dem Feld mit Geburtsdatum für Gleichnamige) > erledigen lassen. Hi, ich hatte eben nochmal die Anträge angeschaut, wir haben da tatsächlich einen Barcode mit einer relevanten Nummer für den Dateinamen drauf. Das würde zumindest die Zuordnung erleichtern.
Εrnst B. schrieb: > Wenn du später sowieso OpenCV dahinterhängen willst, lass doch OpenCV > auch gleich den Bildausschnitt suchen. Ja tatsächlich stand ich gerade in Kontakt mit einem ehemaligen Kollegen, der meinte , dass mit OpenCV das Passbild sehr gut aus dem Gesamtantrag herauszufischen wäre. Allerdings müsste man dann komplett DIN A4 hochwertig einscannen. Vermutlich wäre dann ein 2-stufiger Scan nötig. Zuerst die Bildposition feststellen lassen und dann die Position mit ausreichend DPI nochmal reinziehen. Vielleicht wären Marker doch nicht so schlecht ... müsten wir mal gucken wie wir die im XSL reinplatzieren und hoffen, dass die User die net überkleben ;-) Danke und Gruß !
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.