Hallo, ich scanne gerade diverse Textdokumente (A4) ein. Das mache ich in 600 DPI und Schwarz/Weiß, was einen ganz guten Kompromiss zwischen Qualität und Dateigröße ergibt. Allerdings würde ich die Scans gerne noch etwas aufhübschen. Folgendes stört mich: - Manche Seiten werden leicht schief eingezogen, und sind daher dann geringfügig schief - Die Textqualität ist an den Kanten etwas unsauber (vermutlich durch den SW-Scan) - Zum Teil sind Artefakte an den Seiten (dunkle Ränder), wenn das Blatt schief eingezogen wurde Daher überlege ich nun, ob man was dagegen tun kann. Z.B. könnte ich in Graustufen scannen, um mehr Bildinformationen zu retten. Anschließend wäre eine (automatisierte) Software-Nachbearbeitung sicherlich in der Lage, schönere Schwarz/Weiß Bilder zu erzeugen, als es der Scanner direkt kann. Kennt jemand Tools mit denen sowas möglich ist? PS: "unpaper" habe ich ausprobiert. Das funktioniert gar nicht (entweder stürzt es ab oder erzeugt kauptte Dokumente).
Horscht schrieb: > - Manche Seiten werden leicht schief eingezogen, und sind daher dann > geringfügig schief Einzug reparieren.
sehr interessante Frage. mich würde noch interessieren, ob es eine Software gibt, aus der man über die verschiedenen Graustufen wieder die Originalfarben rekonstruieren kann.
Was ist das Ziel der Scan-Aktion? Normal wäre, dass gescannter Text per OCR eben wieder in (durchsuchbaren) Text umgewandelt wird und lediglich Bilder und Grafiken im Original verbleiben. Wir verwenden in der Firma z.B. "Readiris 17 Pro", das kann u.a. auch Seiten geradestellen und der per OCR erkannte Text ist logischerweise danach absolut sauber und scharf. Zudem sinkt die Dateigröße in beachtlicher Weise. Für OCR sind 600 dpi deutlich übertrieben, üblich sind eher 300 dpi (ergibt 1/4 der Dateigröße). Auch für Bilder und Grafiken aus gedruckten Büchern ergibt das wegen der Rasterung nicht wirklich Sinn. Dann wäre da noch das Dateiformat. Für Bilder mit harten Kanten (Buchstaben!) ist JPEG (wegen der DCT) eher weniger geeignet, produziert Artefakte und Geisterpixel. Hier passen TIFF oder PNG deutlich besser.
fragjanur schrieb: > sehr interessante Frage. > mich würde noch interessieren, ob es eine Software gibt, aus der man > über die verschiedenen Graustufen wieder die Originalfarben > rekonstruieren kann. Bestenfalls Falschfarben wie Thermobilder :-) Informationen, die nicht aufgenommen werden, sind schlicht nicht vorhanden. Mit Regeln oder gar KI-Algorithmen könnte man evtl. die Textstruktur erfassen und z.B. alle Überschriften blau und den Mengentext schwarz einfärben ...
fragjanur schrieb: > sehr interessante Frage. > mich würde noch interessieren, ob es eine Software gibt, aus der man > über die verschiedenen Graustufen wieder die Originalfarben > rekonstruieren kann. Nein. Und wenn Du nur ein bischenbischen nachdenken würdest würdest Du auch selber darauf kommen das dem so ist das es nciht geht. Selbst die Evolution hat das nicht hinbekommen, für dieses "Problem" aber bemerkenswerte Anpassungen hervorgebracht (scheinbares Farbsehen im Mondlicht)
MiWi schrieb: > Nein. > > Und wenn Du nur ein bischenbischen nachdenken würdest würdest Du auch > selber darauf kommen das dem so ist das es nciht geht. nicht jedem ist es gegeben, Ironie zu erkennen ;-)
Horscht schrieb: > Kennt jemand Tools mit denen sowas möglich ist? Der Acrobat Professional macht das alles recht gut.
Horscht schrieb: > Daher überlege ich nun, ob man was dagegen tun kann. Z.B. könnte ich in > Graustufen scannen, um mehr Bildinformationen zu retten. Anschließend > wäre eine (automatisierte) Software-Nachbearbeitung sicherlich in der > Lage, schönere Schwarz/Weiß Bilder zu erzeugen, als es der Scanner > direkt kann. Es gibt spezielle Dokumentenscanner. Die machen genau das, was Du willst. Die haben Sensoren, um zu erkennen, wenn mehrere Blätter auf einmal eingezogen werden. Die richten Textseiten automatisch aus, so dass der Text nicht nur gerade, sondern auch lesbar (richtigrum) ist. Die erkennen Ränder und können die Artefakte entfernen. Die haben einstellbare Blindfarben (rot oder grün), die beim Lesen nicht erkannt werden. Die können andersfarbige Trennblätter automatisch erkennen und Jobs entsprechend separieren. usw. usw. Anbieter sind vor allem Fujitsu und Kodak (jetzt Alaris). fchk
Frank K. schrieb: > Es gibt spezielle Dokumentenscanner. Die sind so schnell wie manche Geldzählmaschine und kosten mehr als 3,50€. Nachcolorieren ist eine andere Geschichte. Jedenfalls kann man aus einem schlecheten Scan kein super Foto machen.
Bezüglich Farben aus Graustufen, was bereits heute möglich ist: https://imagecolorizer.com/de/colorize.html oder https://deepai.org/machine-learning-model/colorizer MfG
Horscht schrieb: > Kennt jemand Tools mit denen sowas möglich ist? Wenn Bastelleidenschaft vorhanden ist, kann ich die netpbm-Suite empfehlen. Das ist eine Kramkiste mit allen möglichen Kommandozeilen-Werkzeugen, die sich gut scripten lassen. "Schwarze Ränder entfernen" geht angeblich mit pnmcrop; habe ich aber selbst noch nicht ausprobiert. Zum "Kanten glätten" habe ich einen relativ einfachen Algorithmus entwickelt; Arbeitsprobe im Anhang, Details bei Bedarf. "Seite automatisch ausrichten" ist noch ungelöst; das ist aus verschiedenen Gründen eine recht komplexe Sache.
Hier gibt es diverse Tips: https://www.radiomuseum.org/forum/schaltplaene_perfekt_mit_irfanview_398.html oder https://www.radiomuseum.org/forum/schaltbilder_wie_gute_schaltbilder_und_texte_erarbeiten.html Artikel sind ohne Anmeldung einsehbar!
oszi40 schrieb: > Frank K. schrieb: >> Es gibt spezielle Dokumentenscanner. > > Die sind so schnell wie manche Geldzählmaschine und kosten mehr als > 3,50€. > Wo ist da das Problem? Dafür bekommt man auch einen 2-Seiten-Scanner mit 10-Blatt-Einzug. Und so langsam sind die auch wieder nicht. Ich habe den Canon imageFormula, der ist schneller als manch ein Flachbettscanner.
Egon D. schrieb: > "Seite automatisch ausrichten" ist noch ungelöst; das > ist aus verschiedenen Gründen eine recht komplexe Sache. Wenn Du in Python oder Matlab skriptest, geht das über eine Singulärwertzerlegung. Jedes Pixel wird über Helligkeit (oder Schwellwert) und x-y-Koordinate gewichtet. Mit einer Singulärwertzerlegung findet man die Hauptachsen. (2 Gleichunge, 2 Unbekannte). Wenn die Pixel irgendwie gehäuft in horizontalen Linien angeordnet sind (Zeilen), funktioniert das prima. (Ich hatte das mal in Matlab gescriptet, aber mein aktueller Scanner hat es schon eingebaut.)
:
Bearbeitet durch User
Horscht schrieb: > Allerdings würde ich die Scans gerne noch etwas aufhübschen. Imagemagick wird oft empfohlen, z.B. hier: https://superuser.com/questions/204230/which-free-software-can-i-use-to-deskew-scanned-images Als Suchwort kannst Du z.B. "deskew" benutzen
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.