Forum: PC Hard- und Software OCR zur Bilderkennung ?


von Der kein Bock mehr A. (Gast)


Lesenswert?

Hallo liebe Gemeinde, ich suche grob unter dem Thema OCR genau das 
Gegenteil ;-)

Ich habe Formulare mit aufgeklebten Passfotos, die ich extrahieren und 
weiterverarbeiten muss.

Kann man da auch mit tesseract o.ä. arbeiten ? Die Formulare könnten 
auch nochmal angepasst werden , z.B. mit speziellen Markern ums 
Bildfeld, sodass die Software das besser finden kann.
Derzeit muss das alles von Hand gecroppt werden und macht sauviel 
Arbeit.

Beitrag "Re: Bilderkennung von Daten in bildern"

ginge das damit evtl. ?

Es geht um Nicht-kommerzielle Nutzung im Bildungsbereich, die Formulare 
werden von Hiwis eingescannt, die liegen manchmal nicht gerade auf dem 
Scanner oder die Passfotos sind schepp aufgeklebt etc.

Die weitere Verarbeitung würde ich vermutlich für eine Gesichtserkennung 
nochmal über opencv laufen lassen.

LG & THX

von Frank E. (Firma: Q3) (qualidat)


Lesenswert?

Mit etwas selbstgeschriebener Software sollte sich das Cropping auf 2 
Mausclicks (für exakt gerade aufgeklebte Bilder), schlimmstenfalls auf 3 
Klicks (mit schief-aufgeklebt-Ausgleich) reduzieren lassen. Den 
Dateinamen könnte man per OCR aus einem Bereich der Vorlage mit Name 
(und evtl. zusätlich dem Feld mit Geburtsdatum für Gleichnamige) 
erledigen lassen.

Kommt darauf an, ob sich der Aufwand (ca. 6..8h für einen erfahrenen 
Programmierer) aufgrund der Masse der Vorlagen lohnt ...

von Εrnst B. (ernst)


Lesenswert?

Wenn du später sowieso OpenCV dahinterhängen willst, lass doch OpenCV 
auch gleich den Bildausschnitt suchen.

z.B. per Histogram den "buntesten"/"dunkelsten" Bereich im Scan suchen.

Evtl. etwas vorverarbeiten (Grayscale, leichter GaussianBlur), dann 
Linien(Contour)-Erkennung über den Bereich (opencv -> Features2d).

Aus dem Linien-Wust die Bounding Box für das Passbild rausrechnen
(das ist etwas tricky... evtl: findContours, approxPolyDP, 
convexHull/isContourConvex, nach Fläche und Umfang filtern ...)

so bestimmten Bildausschnitt (aus originalbild) rotieren/skalieren
(getAffineTransform, warpAffine, ...) und wegspeichern.

von Der kein Bock mehr A. (Gast)


Lesenswert?

Frank E. schrieb:

> Den
> Dateinamen könnte man per OCR aus einem Bereich der Vorlage mit Name
> (und evtl. zusätlich dem Feld mit Geburtsdatum für Gleichnamige)
> erledigen lassen.

Hi, ich hatte eben nochmal die Anträge angeschaut, wir haben da 
tatsächlich einen Barcode mit einer relevanten Nummer für den Dateinamen 
drauf. Das würde zumindest die Zuordnung erleichtern.

von Der kein Bock mehr A. (Gast)


Lesenswert?

Εrnst B. schrieb:
> Wenn du später sowieso OpenCV dahinterhängen willst, lass doch OpenCV
> auch gleich den Bildausschnitt suchen.

Ja tatsächlich stand ich gerade in Kontakt mit einem ehemaligen 
Kollegen, der meinte , dass mit OpenCV das Passbild sehr gut aus dem 
Gesamtantrag herauszufischen wäre. Allerdings müsste man dann komplett 
DIN A4 hochwertig einscannen.

Vermutlich wäre dann ein 2-stufiger Scan nötig. Zuerst die Bildposition 
feststellen lassen und dann die Position mit ausreichend DPI nochmal 
reinziehen.

Vielleicht wären Marker doch nicht so schlecht ... müsten wir mal gucken 
wie wir die im XSL reinplatzieren und hoffen, dass die User die net 
überkleben ;-)

Danke und Gruß !

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.