Forum: Offtopic Spracheingabe und Fingerabdruck-Erkennung bei iPhones


von 3C273 (Gast)


Lesenswert?

Hallo Fachmänner!

Erstmal ein schönes Weihnachtsfest von einem anonym-bleiben-wollendem 
Frager! ;-)

Ein Freund hat mir vorgestern ein "Apfel" - iPhone gezeigt und, was das 
so alles für Sachen kann. Können bestimmt die meisten anderen Dinger 
auch und das soll nun keineswegs eine Werbung für die 
"Wisch-Display-Fans" sein, aber, was ich zum Beispiel nicht verstehe, 
ist die Spracheingabe-Funktion, wie die hier praktiziert wird!
Spracheingabe gibt es schon seit Windows 98 oder noch früher. Damals 
musste der Rechner aber "angelernt" werden, konnte also nur vom grossen 
Trainer selbst bedient werden.
Wie geht das jetzt?
Sogar ein kleiner Dialekt-Einschlag scheint keine Rolle mehr zu spielen.
Und die Erkennung mittels Fingerabdruck beim Einschalten? OK, das Muster 
ist bei jeder Person einmalig, aber die Struktur ist doch irre komplex!

Klärt mich bitte auf!

: Verschoben durch User
von Weihnachtsmann (Gast)


Lesenswert?

Kein Problem, Thomas:

http://de.wikipedia.org/

von 3C273 (Gast)


Lesenswert?

Guten Abend, Herr Weihnachtsmann,

hier spricht der Quasar 3C273 aus etwa 2.5 Milliarden Lichtjahren 
Distanz zum Planeten Erde ;-)
>Kein Problem, Thomas:
Wozu wird das Sch...-Fest eigentlich dann noch gefeiert, wenn ohnehin 
keiner mehr an die Ursprünge glaubt? Kommerz? Money-money?? Geschenke, 
die niemand will? Einmal im Jahr Wonne, Schmalz, Grinsen und Kekse?

Na gut, eigentlich war das nicht meine Frage an sich. Die könnte man an 
andere Religionsanhänger, denen das sogenannte Christentum egal ist, 
auch stellen und das getraut sich anscheinend niemand, weil davor jeder 
die Hosen gestrichen voll hat. ;-)

Ich frage mich oft nur, warum ein verrückter Hobbytüftler und Roboterfan 
sich zum Bleistift mit einem GPS-Modul herumschlägt, wenn das Ding 
sowieso fast überall integriert ist. :-)

MfG

von Max D. (max_d)


Lesenswert?

Die Spracherkennung ist inzwischen aus 2 Gründen besser:
1. Das iPhone (genauso wie andere Schmarrphones) hat im Shclafmodus mehr 
Rechenpower übrig als die 98er PCs wenn man sie an glühgrenze werkeln 
lässt
2. Das Ding ist mit dem Internet verbunden und kriegt von einem Server 
Hilfe wenn es dich nich versteht (so is dass zumindest bei meinem 
Droiden)

Der Finderabdruck wird nicht als Bild gespeichert sondern als hash-wert.
d.h. beim anlernen wird aus dem Bild von deinem Abdruck eine Prüfsumme 
errechnet (k.a. wieviele bits apple da ins rennen wirft) und bei 
drauffolgenden scans verglichen (es wird vmtl. ein verfahren verwendet 
das soundsoviel % Fehler erlaubt, falls du etwas Dreck an den Fingern 
hast).

Diese ganzen Sachen machen die neueren Prozis mit ihren vielen 
gigaherzen ;) locker nebenher. Wenn man genug Prozessorpower hat kann 
man lustige Sachen machen :D

von 3C273 (Gast)


Lesenswert?

Hallo Max,

danke für die Erklärung! Mir ist der Algorithmus trotzdem nicht klar!
Vor langer Zeit musste man ja sehr deutlich sprechen, um die 
Spracheingabe zu  aktivieren. Das scheint nicht mehr der Fall zu sein.
Das mit dem Fingerabdruck verstehe ich gar nicht! Das muss ja eine 
riesige Datenmenge sein, um den Menschen zu identifizieren!
Als Hobby-Programmierer kommt man sich da schon etwas mickrig vor...
Ist hat mein Eindruck.

Herzliche Grüsse

Gerd

von Max D. (max_d)


Lesenswert?

Die Datenmenge für einen Fingerabdruck ist garnicht so groß.
Mal zum vergleich: 2^512 (64 Byte) = 1,34078079299e+154 . Das sind mehr 
Möglichkeiten als es Atome im beobachtbaren Universum gibt und das in 
nur 64 Byte, der kleinste AVR hat 1 kB Speicher, das ist 16 mal so viel. 
So viel Datenmenge braucht man also garnicht. Natürlich wird das 
Fingerabdruck verfahren etwas filigraner vorgehen, aber die Grundlage 
bleibt.
Die wirklichen Algorithmen wie Apple den Fingerabrudck hasht werden sie 
kaum rausrücken...
Die damalige Spracherkennung war ein Vergleich zwischen deinen 
gespeicherten Worten und dem was da durch das Mic kommt. Wie man das 
heutzuatge macht erklärt wiki besser als ich: 
http://de.wikipedia.org/wiki/Spracherkennung :D

von spess53 (Gast)


Lesenswert?

Hi

>Das mit dem Fingerabdruck verstehe ich gar nicht! Das muss ja eine
>riesige Datenmenge sein, um den Menschen zu identifizieren!

Hier mal ein Prinzip:

http://www.heumann-webdesign.de/pages/biometrie/verfahren/finger/bv-fing.html

MfG Spess

von Frank M. (frank_m35)


Lesenswert?

Ich verstehe deine Verwunderung nicht.

Am einfachsten kannst du dir doch vorstellen, du speicherst den 
Fingerabruck als Bitmap ab. Wie groß ist das bitmap nun? Ein paar 
Kilobyte. Und dieses Bitmap wird nun mit einem zweiten verglichen und 
geschaut wie gut es übereinanderpasst. Bei 90% übereinstimmung wird der 
Fingerabdruck akzeptiert. Was ist daran jetzt so beachtlich?
(natürlich wird der Fingerabdruck eben mit einem Array von Kapazitiven 
Sensoren aufgenommen, ebenso setzt eine interne Software deinen 
Fingerabdruck beim Anlernprozess aus vielen Aufnahmen zusammen, sodass 
beim Anmeldeprozess die Orientierung deines Fingers sich ändern kann)

Bei der Spracherkennung wurde der Trick schon gesagt. Damals waren die 
Rechner langsam und Speicher begrenzt. Heute ist es egal ob man 1GB an 
Sprachdaten hinterlegt, damals war die Festplatte dann voll und der PC 
ein paar Stunden beschäftigt die durchzuarbeiten. Heute liegen diese 
Daten im RAM und die CPU rattert das in ein paar ms durch. Hinzu kommt, 
dass heutzutage nicht nur lokale Sprachdaten, sondern auch globale 
verwendet werden können. Siri greift auf Apple Server zurück welche bei 
der Umwandlung helfen und dabei aber auch stetig weiterlernen, sodass 
bei der nächsten Benutzung andere User profitieren. Dadurch, dass eben 
mehr Speicher zur verfügung steht und auch mehr Rechenpower, kann auch 
der Kontext deines Satzes, die App in der du dich befindest, der Ort, 
... mit beachtet werden um so nachfolgende Wörter besser erraten zu 
können (was viele Touch-Tastaturen auf Smartphones auch machen, ebenso 
wie jeder Mensch).

Kurz und knapp:
Mehr Rechenpower, mehr Speicher und dank Internet ein leichtes sammeln 
von Sprachdaten von vielen vielen unterschiedlichen Menschen macht's 
möglich.

von 3C273 (Gast)


Lesenswert?

Hallo Max!
Irgendwie -für mich zumindest- fast unheimlich. ;- So nach dem Motto 
"The big brother is decoding you" ;-) aber, der "watcht" ohnehin schon 
lange mit Facebook , Tante Google usw. ;-)
Zum Glück hab ich keine Geheimnisse. Jedenfalls keine, die die 
Öffentlichkeit interessieren und vor allem aufregen würde! ;-)

von 3C273 (Gast)


Lesenswert?

Frank, entschuldige da, war ich jetzt zu spät am Lesen! Hole ich gleich 
mal nach.

von F. F. (foldi)


Lesenswert?

Max D. schrieb:
> Der Finderabdruck wird nicht als Bild gespeichert sondern als hash-wert.

Sind dann auch nicht so viele Daten, die so direkt an die NSA 
übermittelt werden.
Bin gespannt wann der erste Aufruf kommt den nächsten Finger zu nehmen.

Von mir kriegen die nur einen Finger, den Mittelfinger!

von Max D. (max_d)


Lesenswert?

Ich hab auch keine iPawn mit Fingerabdruck Schnüffler. Bei mir sind alle 
schnüffelbaren Daten bei einem Anbieter (Tante Google) vereint :D. Weil 
einfach der Verzicht schwerer wiegen würde als die Sorgen die ich 
deswegen hab.

PS: und Ja, ich hab auch kein sozial-striptease-Profil beim 
großen-kleinen f ^^

von 3C273 (Gast)


Lesenswert?

>Ich hab auch keine iPawn mit Fingerabdruck Schnüffler. Bei mir sind alle
>schnüffelbaren Daten bei einem Anbieter (Tante Google) vereint :D.

Herrlich! :-)

> ich hab auch kein sozial-striptease-Profil

Noch besser! Ich hasse die Big Brothers, weshalb ich mich dem 
Internet-STASI auf freiwilliger Basis nur begrenzt und wenn, dann 
absichtlich in sehr verfälschter Form preisgebe, obwohl ich, soweit ich 
das beurteilen kann, wirklich nix zu verbergen habe. Aber, mich zipft 
das öffentliche Ausziehen gewaltig an, obwohl ich das ja eigentlich mit 
jeder Zeile hier ja in gewisser Weise mache. ;-)  (Und nicht mal anonym, 
weil ein niedliches "Ping" den Standort entschlüsseln kann und somit den 
wahren Schreibetäter ;-) )
Für ganz grauenhaft halte ich das Gesichtsbuch. Die Gier, endlich mal 
"berühmt" zu werden. "Berüchtigt" wäre in den meisten Fällen der bessere 
Ausdruck. :-)
Darum bin ich als alter Knacker (heutzutage liebevoll von zukünftigen 
Auslaufmodellen als Auslaufmodell bezeichnet) mit Begeisterung auf Linux 
umgestiegen. Nicht ganz, aber zum Großteil. Ein paar Progrämmls gibt es 
noch, die ich unter Windoof-Schnüffel benötige. (Sprint-Layout 6.0, 
Pinnacle Studio 16, Silverfast für den Großformat-Durchlichtscanner und 
mein altes, aber wirklich einmaliges AutoCAD14, von dem ich nicht weiss, 
wodurch ich es ersetzen könnte. Da war ich von den DOS-Zeiten her schon 
mit dabei. )
Das wärs dann eigentlich schon. GIMP, Open Office, Stellarium, alles das 
unter Linux und C sowieso und Mint 13 habe ich. Mate von den Mayas, 
nicht das mit Zimt, da mag ich schon die Effekte nicht mehr. Bin 
spartanisch veranlagt. ;-)
Wer sich mit Linux befasst, ist meiner Ansicht nach ganz klar im 
Vorteil. Schnell wie die Feuerwehr, schlank, sicher und mit jeder Menge 
an prima offener Software von Programmierern, die bestimmt häufig den 
"Pay-Programmern" gratis Ideen liefern, die dann teuer auf den Markt 
geworfen werden.
Und, wer sich mit Elektronik-Grundkenntnissen zusätzlich befasst, hat 
noch mehr Pluspunkte.  Programmierung allein tut's nicht. Ich habe mir 
(unnötigerweise bestimmt) ein GPS-Modul zum Üben bestellt, obwohl das 
mittlerweile in jedem "Händi" integriert ist. Mir taugt das aber. Zum 
Zwecke des Erfolgserlebnisses.
Das Erfolgserlebnis ist ja bestimmt auch der Grund, warum man als 
Privatmann versucht, programmiermässig etwas Nettes auf die Beine zu 
stellen. ;-)

So, ungewollt habe ich mich jetzt "ge-outet" (scheussliches Wort). Aber, 
es kennt mich ja eh niemand! Oder doch? ;-)
Feiert mal schön OHNE µCs !
Herzliche Grüsse aus 2.5 Milliarden Lichtjahren!
http://www3.mpifr-bonn.mpg.de/staff/alobanov/3C273-Science/
http://www.aavso.org/vsots_3c273

von F. F. (foldi)


Lesenswert?

Ich glaube jeder hier, der auch Elektronikteile in China bezieht ist 
nicht nur bei der NSA auf der Liste, sondern auch beim 
Verfassungsschutz.
Auch wenn die allermeisten hier sicher nur nette Sachen bauen, sie 
könnten ja evtl. eine Bombe bauen wollen, so wie jeder Koch mit seinem 
großen Messer auch ein Massaker veranstallten könnte.
Bei mir wird mittlerweile jedes Paket beim Zoll aufgemacht, was mich 
nicht stört, wären da nicht die Verzögerungen dadurch.
Seid euch gewiss, ob Gast Account oder nicht, dieses Forum hier wird auf 
jeden Fall überwacht.
"Kunstwerke", der mit seinem Fernzünder, der hat jetzt schon eine 
riesiege Lupe über sich.

von Frank (Gast)


Lesenswert?

Frohe Weihnacht!

Fingerabdrücke werden von einer speziellen Software im Handy analysiert. 
Es geht um den Verlauf der Rillen ("Papillen") und wie oft die sich 
verzweigen bzw. Knoten bilden, die sog. "Minutien". Deren Art und Anzahl 
wird in einem einfachen Nummernsystem kodiert und bildet einen Hash. Der 
direkte Vergleich der Grafiken ist Quatsch und wird nur in Filmen wegen 
des Effektes dargestellt (z.B. CSI).

Die Stimmanalyse (Siri) erfolgt in Wirklichkeit auf einem 
Großrechner-verbund (nicht etwa lokal), zu dem die Sprachaufnahme 
häppchenweise gesendet wird - funktioniert also nur online. Dort stehen 
ganz andere Softwares und vor Allem mehr Rechenleistung zur Verfügung.

von Frank (Gast)


Lesenswert?

Nachtrag: Man kann aus jedem Fingerabdruck-Bild einen Minutien-Hash 
errechnen, aber aus dem nicht das Bild zurückgewinnen.

Bitte melde dich an um einen Beitrag zu schreiben. Anmeldung ist kostenlos und dauert nur eine Minute.
Bestehender Account
Schon ein Account bei Google/GoogleMail? Keine Anmeldung erforderlich!
Mit Google-Account einloggen
Noch kein Account? Hier anmelden.