Hallo zusammen, ich hatte gerade folgenden Bericht gelesen: https://www.heise.de/newsticker/meldung/Nur-kleiner-Teil-der-zerrissenen-Stasi-Akten-wieder-lesbar-3929318.html Das Fraunhofer Institut für Produktionsanlagen und Konstruktionstechnik {Link: https://www.ipk.fraunhofer.de/publikationen/kundenmagazin-futur/futur-archiv-ab-2011/?tx_futurwebview_fwebview%5Barticle%5D=340&tx_futurwebview_fwebview%5Bmagazin%5D=29&tx_futurwebview_fwebview%5Bcontroller%5D=Article&cHash=333b7211d3fd50f7de26cecd525e9202 } hat eine Software entwickelt die wohl gut funktioniert. Nur einen passenden Scanner gibt es wohl nicht, ich meine mich an einen Bericht zu erinnern wo mit Ticketscannern der Lufthansa experimentiert wurde. Die Handscannaktionen sind ja wohl der Witz, wie ineffektiv ist das denn - die armen Leute. Ich hätt ja ne Idee: Was haltet Ihr davon oder habt Ihr eine bessere Idee? Also die Schnipsel mit einem Industrieroborter aufnehmen und auf einen Scanner platzieren dann scannen. oder man machts mit ganz vielen Leuten 40 Millonen also die hälfte der Einwohner Deutschlands müssten dann 50 der 1962434782 Schnipsel scannen (habe ich mal hochgerechent anhand der Zahlen) das müsste doch zu machen sein. Man könnte ja "Scannpartys" veranstalten dann kämen die Leute auch mal wieder direkt in Kontakt als nur wie so oft virtuell. Nagut der zweite Weg ist sehr "ambitioniert" ;-) Bitte keine Diskussion über Sinn und Unsinn der Aktion!!! Vielleicht gäbe es ja auch andere Anwendungen um große "analoge" Daten zu digitalisieren. Na dann schreibt mal was Euch einfällt.
Ich wuerde das ja einfach so machen: https://youtu.be/03ccxwNssmo oder so: https://youtu.be/SdipuAuWsEs Sollte fuer das Fraunhofer ja kein problem sein. ;)
:
Bearbeitet durch User
Ja das ist ne tolle Sache wenn es um geordente Seiten geht, nur wie macht man das mit vielen Schnipseln? Das Video mit der Hochgeschwindigkeitskamera ist gut sowas müsste man machen ist nur das Problem die Schnipsel nebeneinander hinzulegen. Am besten auf eine Glasscheibe und dann von unten und oben ein Foto machen und einmal durch den Softwarefleischwolf.
Frank S. schrieb: > nur wie > macht man das mit vielen Schnipseln? Koennte man vielleicht mit einem Pick'n'Place/FlexPicker-Roboter machen. https://youtu.be/v9oeOYMRvuQ Stapel Schnipsel hinstellen, und der legt das dann Schnipsel fuer Schnipsel auf eine Scheibe. Das Aufnehmen der Blaetter koennte man vielleicht mit einer Art Staubsauger machen. Eine Software muss dann natuerlich gucken, das sich keine Schnipsel ueberlappen. Damit sollte man schon einen ordentlichen Stapel an Schnipseln pro Stunde wegbekommmen.
:
Bearbeitet durch User
Ich denke nicht, dass das ein grosses Problem waere ... allenfalls muss eine Generation vergehen, bis der Inhalt neutraler betrachtet werden kann. Es gibt Software, die kann die Schnittkanten zusammensetzen. Jetzt muss man nur noch ein paar Motivierte finden, resp erzeugen, die die Scanner bedienen...
Mal eine Frage an die alten Ossis hier: Interessiert das überhaupt noch jemanden oder ist langsam der Zeitpunkt gekommen, wo man einfach Gras über die Sache wachsen lassen sollte?
@ Thomas Eckmann (Firma: Thomas Eckmann Informationst.) (thomase) >Mal eine Frage an die alten Ossis hier: Interessiert das überhaupt noch >jemanden oder ist langsam der Zeitpunkt gekommen, wo man einfach Gras >über die Sache wachsen lassen sollte? Bei anderen, ca. 70 Jahre alten historischen "Ereignissen" ist man auch sehr bemüht, KEIN Gras drüber wachsen zu lassen. . . Hmmm.
Die Seite ist ganz informativ. https://www.bstu.bund.de/DE/Archive/RekonstruktionUnterlagen/_node.html#doc1750908bodyText11 Demnach werden vor dem Scannvorgang die Schnipsel erst nach Farbe, Schrift in Boxen sortiert. Dann wird alles verschickt und woanders gescannt. Online finden sich übrigends verschiender Bilder von den unterschiedlich eingesetzen Scannern. Das wirkt schon so das mehrere Schnipsel aufeinmal gescannt werden. Nur das bisher nur 23 Säcke rekonstruiert werden konnten ist ja echt nicht soviel. Immerhin hat sich der Bundesrechungshof der Sache angenommen.
:
Bearbeitet durch User
Die Nachfrage nach Akteneinsicht ist nach wie vor hoch und sogar steigend, wie ich letztens las. Mich selbst betrifft es weniger, ich war 10 als die DDR zusammenbrach, aber ich kenne viele aus dem persönlichen Umfeld, die das schon noch wissen wollen. Meines Wissens war das ein öffentlich gefördertes Projekt bei Fraunhofer und das war dann halt irgendwann zu Ende. Und wie so oft wird sich kein Geldgeber für Folgeprojekte zur Verbesserung gefunden haben. Mit genügend Geld kann man das sicher extrem beschleunigen. Ach, da unter dem Link von oben stehts ja auch direkt und unverblümt:
1 | Wie ist das Projekt virtuelle Rekonstruktion finanziert? |
2 | |
3 | Der Bundestag bewilligte für das Pilotprojekt einmalig 6,3 Millionen Euro. Diese Summe war für den gesamten Zeitraum der Technikentwicklung und der Testphase mit der Zusammensetzung von Schnipseln aus genau 400 Säcken bestimmt. Die Planung sah für das Pilotprojekt acht "Meilensteine" mit jeweiliger Vergütung vor. Mit der Abnahme des siebten Meilensteins Ende 2013 hat der BStU die Funktionsfähigkeit der neu entwickelten Software bestätigt. Gleichzeitig wurde im Verlauf des Jahres 2014 das Projekt vom Fraunhofer IPK angehalten, da erkennbar ein Abschluss des ursprünglichen Projektplans, also des kompletten Puzzelns von 400 Säcken, mit der vorhandenen Technik nicht durchführbar war. Bis zu diesem Zeitpunkt waren Schnipsel aus 23 Säcken gescannt, die alle virtuell rekonstruiert werden. |
:
Bearbeitet durch User
Christian R. schrieb: > Und wie so oft wird sich kein > Geldgeber für Folgeprojekte zur Verbesserung gefunden haben. > Mit genügend Geld kann man das sicher extrem beschleunigen. [Aluhut] Ein Problem das ich bei diesem Projekt sehe: Diese Akten sind eine ungeheure Datenquelle. Moeglicherweise sind da auch Daten bei, von denen nicht jeder will, das sie Konzerne in die Haende bekommen. Ich wuerde es einer Firma wie z.B. Google, Facebook, etc. zutrauen, so ein Projekt umzusetzen. Aber will man diese Daten wirklich solch einem Konzern anvertrauen? Ein Geldgeber will natuerlich auch was fuer seine Investition erhalten, und grossartig Geld verdienen duerfte mit diesem Projekt nicht drin sein. Also muesste sich das ganze eben anders rentieren. Jetzt also die Frage: Wer kaeme denn, nach obigen Gesichtspunkt, ueberhaupt als Geldgeber in Frage? Der Staat ist ja teilweise nicht besser als die oben genannten Firmen... [/Aluhut]
Frank S. schrieb: > hat eine Software entwickelt die wohl gut funktioniert. Nur einen > passenden Scanner gibt es wohl nicht, Der normale Forschungsförderungs-Wahnsinn. Für praktische Aufgaben, bei denen reale Ergebnisse erzielt werden sollen taugen solche Forschungsspezis nichts. Jeder halbwegs normal denkende Ingenieur hätte als erstes gefragt "Sch**ße, wo bekommen wir die Schnipsel automatisch gescannt?". Ein Professor Doktor von Trallala von einer Eliteuni stellt sich statt dessen hin, sagt "Wir nehmen mal an es gibt geeignete Scanner, dann ..." und hofft auf das Wunder, dass die Scanner irgendwann vom Himmel fallen. Das ist die Anwendung des Konzepts wie Mathematiker Löwen fangen. Wenn man dann sogar in künstlich geschaffenen freundlicher Umgebung versagt (nur 23 von 400 Säcke), dann solle man sich nicht "Forschung für die Praxis" auf die Fahne schreiben. 23 von 400 Säcken virtuell (also scheinbar) zu rekonstruieren ist eine Quote von 5,75%. Fordert man statt einer scheinbaren eine echte Leistung dann hat Frauenhofer saubere 0,0% geleistet. Hauptsache sie haben ein bisschen mehr Staatsknete abziehen können und es sind ein paar hübsche Aufsätze zur persönlichen Karriereförderung entstanden.
Jup, so läuft es leider bei vielen öffentlichen Projekten. Bei Fraunhofer kommt schon auch oft was raus, aber meistens nur in den Industrie-Projekten. Denn da gehts um anfassbare Ergebnisse, da reicht kein Stapel buntes Papier wie beim BMBF. Die sind natürlich nicht so öffentlich bekannt gegeben. Allerdings ist es in den bei öffentlich geförderten Projekten beteiligten KMUs noch viel schlimmer. Denn die machen so gut wie gar nix, Fraunhofer darf denen dann noch den Antrag und die Berichte schreiben, und das bissl was raus kommt, dürfen sie dann dafür vermarkten bzw. weiter verwenden. Ist halt so gewollt, und Grundlagenforschung klappt nur über öffentliches Geld mit Zeit zum spinnen. Beides hat seine Berechtigung. Im konkreten Fall ist das wirklich schade, aber da muss man sich halt auch die Frage stellen, wo der ROI sein soll, da ist es natürlich kein Wunder, dass der Staat nicht mehr Kohle locker machen will. Bei "normalen" öffentlichen Projekten besteht ja wenigstens die Hoffnug auf einen geringen ROI über Steuern wenn mal was vermarktungsfähiges raus kommen sollte, aber beim STBU...naja...
Man will das Projekt verhungern lassen. Die Stasi hat nicht nur die eigenen Bürger überwacht, sondern war auch im Ausland recht erfolgreich bei der Informationsbeschaffung. Dabei dürfte bei so manchem Politiker, Abgeordneten oder Manger im Westen so manches an Infos gefunden worden sein, von dem man in gar keinem Falle will, dass das irgendwie ruchbar wird. Wahrscheinlich sind bereits erste Infos dieser Art in der bisher gescannten geringen Menge aufgetaucht und nun herrscht die blanke Panik. Wenn Altkanzler Kohl z.B. so ein tadelloser Ehenmann war, wie allgemein dargestellt, dann sollte die Stasi doch nur Gutes über ihn zu berichten haben ... oder?
> Wahrscheinlich sind > bereits erste Infos dieser Art in der bisher gescannten geringen Menge > aufgetaucht und nun herrscht die blanke Panik. Der Verdacht ist nicht ganz von der Hand zu weisen. Ich würde schätzen, dass eine Mittelstandsfirma für unter 200 k€ eine einigermaßen flott funktionierende Schnipselvereinzelungsmaschine für den Scanner bauen kann. Früher hätte man das im Ratiomitteleigenbau gemacht. Dass das Fraunhoferdingens das nicht kann, liegt auf der Hand.
Falk B. schrieb: > Bei anderen, ca. 70 Jahre alten historischen "Ereignissen" ist man auch > sehr bemüht, KEIN Gras drüber wachsen zu lassen. . . Hmmm. Es war eine Frage an die Betroffenen und keine Aufforderung das zu tun.
Thomas E. schrieb: > Es war eine Frage an die Betroffenen Ob du betroffen warst, weisst du erst, wenn die Schnipsel zusammengesetzt und gescannt wurden... ;-)
Bernd G. schrieb: > Ich würde schätzen, dass eine Mittelstandsfirma für unter 200 k€ eine > einigermaßen flott funktionierende Schnipselvereinzelungsmaschine für > den Scanner bauen kann. > Früher hätte man das im Ratiomitteleigenbau gemacht. > > Dass das Fraunhoferdingens das nicht kann, liegt auf der Hand. Ich bin jetzt mal ganz mutig: Ich traue mir zu, mit einer Kamera, einem PC, einigen Servos und etwas Pneumatik aus den Schnipseln, sofern sie flach und in geringer Schütthöhe (1..2cm) z.B. auf einem Band von ca. 20cm Breite liegen, alle 2s Sekunden eines herauszufischen und auf einer Glasplatte abzulegen. Dann wird es zunächst grob mit einer Videokamera von Oben und von der Seite betrachtet, um festzustellen ob es evtl. geknüllt ist oder zu groß. Solche Kandidaten werden in einen extra Behälter ausgestossen und müssen von Hand zurecht gemacht werden. Für den vermuteten "Normalfall" (kleiner Schnipsel, rel. flach) senkt sich dann eine zweite Glasplatte, um den Delinquenten flach zu drücken und das Ding wird von zwei Seiten gleichzeitig fotografiert. Feddich. Kosten für den Prototyp: 15.000 € und 6 Wochen. Wer hält dagegen? :-)
Wer hält dagegen? Ab in die Zeitmaschine und zurück in die DDR: Abschluss einer Neuerervereinbarung mit vier Neuerern (den Chef eingeschlossen, damit der nicht sehen will, dass das Ding in der regulären Arbeitszeit gebaut wird), á 1000 Ostmark und innerhalb von vier Wochen ist das Ding da.
Bernd G. schrieb: > Wer hält dagegen? Ich. ;) Warum? Weil die Zeitmaschine erst jetzt und hier gebaut werden müßte, um wieder dahin zurück zu gelangen. Das würde aber heute so lange dauern, daß das Papier samt der Säcke bis dahin zu Staub zerfallen wäre. ...und ein eisiger Wind weht einzelne SSD-Datenträger voller EN, ROHS und weiß der Teufel was für Normen in den Rinnstein. SCNR Paul
Frank E. schrieb: > Kosten für den Prototyp: 15.000 € und 6 Wochen. Wer hält dagegen? :-) na das kommt mir dann doch zu günstig vor. Denk doch mal alleine an die Software zum auswerten. Würde sagen 15k€ is da eher die Hardware. Online gefunden das ein Problem auch die Auswertung ist wg. den riesiegen Datenmengen. Man mus ja quasi einen Schnippsel mit allen anderen bekannten Schippseln abgleichen.
M. S. schrieb: > Man mus ja quasi einen Schnippsel mit allen > anderen bekannten Schippseln abgleichen. Ja, das ist am Anfang des Prozesses unheimlich langsam. Man müßte zunächst alle Schnipsel mit 2 geraden Kanten heraussuchen lassen, denn die stellen ja die 4 Ecken des Blattes dar. Dann die Schnipsel ohne jeden Inhalt, denn die sind für die Information ja völlig Brust. Wenn das erledigt ist, erklärt man EINEN beliebigen Schnipsel zu Startpunkt und lässt suchen, wer an dessen Kanten heranpasst. Normalerweise müßte die Geschwindigkeit mit jedem erkannten und zugeordnetem Schnipsel rasant szteigen. MfG Paul
Wie ist das mit diesen Sortieranlagen für Metall usw. da werden die Stückchen mit kurzen Luftstößen in die richtige Richtung gelenkt. Wenn ich das richtig verstanden habe, dann ist das elektronische Sortieren und zusammenfriemeln schon recht weit fortgeschritten.
:
Bearbeitet durch User
Ein nicht unerheblicher Teil der Arbeit, so neulich im Fernsehen, ist das Sortieren nach Papiersorte, das sich nur schlecht automatisieren lässt. Es hat wohl wenig Sinn, einfach irgendwelche Fetzen auf den Scanner zu legen, wenn es überhaupt keinen Zusammenhang zwischen den Schnipseln gibt. Die Reisskanten passen auch oft wg. der Schichtstruktur des Papiers nicht richtig zusammen, es ist also kein normales Puzzle. Sehts positiv, die Jungs sind von der Strasse weg und machen keinen Rüstungsunsinn :-) Allerdings wäre es evtl. sinnvoll, a la SETI dann die Auswertung mit Cloudcomputing auszulagern, denn für die Datenmengen werden sie später schon den einen oder anderen Supercomputer brauchen.
M. S. schrieb: > Frank E. schrieb: >> Kosten für den Prototyp: 15.000 € und 6 Wochen. Wer hält dagegen? :-) > > na das kommt mir dann doch zu günstig vor. Denk doch mal alleine an die > Software zum auswerten. Würde sagen 15k€ is da eher die Hardware. Ich meinte auch nur die opto-mechanische Seite ohne jeden Bezug zum Inhalt. Das war, so wie ich es verstanden habe, das entscheidende Problem. Eine mehr oder weniger geeignete Software soll es wohl geben ...
Matthias S. schrieb: > Ein nicht unerheblicher Teil der Arbeit, so neulich im Fernsehen, > ist > das Sortieren nach Papiersorte, das sich nur schlecht automatisieren > lässt. Es hat wohl wenig Sinn, einfach irgendwelche Fetzen auf den > Scanner zu legen, wenn es überhaupt keinen Zusammenhang zwischen den > Schnipseln gibt. Nunja, dann sollte man neben den geomtrischen Merkmalen auch die genaue Farbe des Papiers (evtl. auch im UV- und IR-Bereich) mit erfassen, unter einer hochwertigen und stabilen Beleuchtung. Dann gehen dafür am Ende aber keine 0815-Webcams. Colormanagement heisst das Zauberwort der Stunde. Überhaupt: Die Zuordnung zu ganz bestimmten Farbeigenschaften sollt das aller erste Sortiekriterium sein. Bei unbeschichtetem Papier spielen dann auch noch Vorder- und Rückseite (Filz- und Siebseite wie der Papierfachmann sagen würde) eine Rolle (Rauhigkeit bzw. Struktur), das muss auch noch berücksichtigt werden.
@ Bernd G. (Firma: LWL flex SSI) (berndg) >> Wahrscheinlich sind >> bereits erste Infos dieser Art in der bisher gescannten geringen Menge >> aufgetaucht und nun herrscht die blanke Panik. >Der Verdacht ist nicht ganz von der Hand zu weisen. Das ist was dran. Die Daten sind brisant. >Ich würde schätzen, dass eine Mittelstandsfirma für unter 200 k€ eine >einigermaßen flott funktionierende Schnipselvereinzelungsmaschine für >den Scanner bauen kann. >Früher hätte man das im Ratiomitteleigenbau gemacht. Die Chinesen oder Inder hätten den Kram ganz pragmatisch schon LÄNGST digitalisiert, nämlich old school halbautomatisch. Man nehme normale, verfügbare Scanner, viele Leute und los. Aber das wäre VIEL zu pragmatisch und keine akademisch/technische Herausforderung.
Frank E. schrieb: > Nunja, dann sollte man neben den geomtrischen Merkmalen auch die genaue > Farbe des Papiers (evtl. auch im UV- und IR-Bereich) mit erfassen, unter > einer hochwertigen und stabilen Beleuchtung. Es ist wohl nicht nur die Farbe, sondern auch Dinge wie kariertes, liniertes oder blankes Papier in allen möglichen Spielarten. Auch das Alter des Papiers spielt eine Rolle. Die Handsortierer, die es ja schon lange nebenbei gibt, riechen wohl sogar ab und zu mal an einem Schnipsel :-P Kann 40 Papiersorten am Geschmack erkennen :-)
Viel interessanteres Material dürften die von unserem späteren ehrenwerten Bundespräsidenten Gauck an die USA übergebenen 13.000 Seiten Stasi-Akten sein, ohne davon vorher eine Kopie gemacht zu haben. Das US-Nationalarchiv gibt aber glücklicherweise die geheimen Akten im Gegensatz zu unserem Staat irgendwann frei. Ich hoffe ich erlebe die ein oder andere brisante Veröffentlichung über die Eliten unserer Zeit noch mit.
Paul B. schrieb: > M. S. schrieb: >> Man mus ja quasi einen Schnippsel mit allen >> anderen bekannten Schippseln abgleichen. > > Ja, das ist am Anfang des Prozesses unheimlich langsam. Man müßte > zunächst alle Schnipsel mit 2 geraden Kanten heraussuchen lassen, denn > die stellen ja die 4 Ecken des Blattes dar. Dann die Schnipsel ohne > jeden Inhalt, denn die sind für die Information ja völlig Brust. Wenn > das erledigt ist, erklärt man EINEN beliebigen Schnipsel zu Startpunkt > und lässt suchen, wer an dessen Kanten heranpasst. Normalerweise müßte > die Geschwindigkeit mit jedem erkannten und zugeordnetem Schnipsel > rasant szteigen. http://www.tagesspiegel.de/wissen/maschine-setzt-zerrissene-akten-zusammen-die-maschine-ist-ein-assistenzsystem-kein-automat/12102202-2.html von 2015 und da war die Rede von 200 Terrabyte .. schon irgendwie krass für Schnippsel.
Frank E. schrieb: > Ich traue mir zu... > ...Kosten für den Prototyp: 15.000 € und 6 Wochen. Wer hält dagegen? :-) Rumtröten kann jeder. Fang an und liefere bis Ende Februar. Die Investition kannst du dir anschließend vom Bund vergolden lassen. Und auch sonst wird man sich drum reißen.
M. S. schrieb: > von 2015 und da war die Rede von 200 Terrabyte Nicht 200TB Schnipsel, sondern Kapazität der Server.
Biete Rauschgenerator für beliebig große Datenmenge für 12 548 412,48 EURO plus Betriebskosten, Hardwarekosten, Mehrwertsteuer und Entwicklungskosten. Ich dachte an etwas Großes, etwa das Meeresrauschen aufzeichnen.
Eines vorab: Unabhängig von der Bewertung meines Beitrages hier: Beitrag "Re: Automatisiert scannen - muss doch gehen?" Was ist an den Überlegungen falsch? MfG Paul
Paul B. schrieb: > Eines vorab: Unabhängig von der Bewertung meines Beitrages hier: > Beitrag "Re: Automatisiert scannen - muss doch gehen?" > > Was ist an den Überlegungen falsch? > > MfG Paul Zettel von einem Stapel einzeln zu entnehmen funktioniert an jedem Bankautomaten zuverlässig. Das war nie ein Problem.
Lutz H. schrieb: > Zettel von einem Stapel einzeln zu entnehmen funktioniert an jedem > Bankautomaten zuverlässig. Das war nie ein Problem. Die sind dort aber alle gleich gross. Zerrissene Banknoten einwerfen klappt auch dort nicht. Aber du wolltest nur trollen, klar. Freitag ist jedoch schon vorbei.
Lutz H. schrieb: > Zettel von einem Stapel einzeln zu entnehmen funktioniert an jedem > Bankautomaten zuverlässig. Das war nie ein Problem. Eben. Das war aber auch nicht das Problem, auf das ich eingegangen bin. Paul
Paul B. schrieb: > Was ist an den Überlegungen falsch? Der Teufel liegt bei solchen Sachen eher im Detail. Andererseits ist dieser Teil des Problem von Fraunhofer geloest worden.
Dumdi D. schrieb: > Andererseits ist > dieser Teil des Problem von Fraunhofer geloest worden. Oh, das hatte ich vorher nicht gelesen. Da kann ich ja stolz auf mich sein, daß ich auf die gleichen Ideen gekommen bin. ;) MfG Paul
Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.