Das Smartphone und das Sprachprofil


Smartphone und SprachsteuerungEs wird Zeit, das Thema Sprachsteuerung von Handy & Co mal ein wenig näher zu beleuchten.

Gerade wird in verschiedenen Medien mit einer angeblichen Sensation aufgemacht. Sprachsteuerung machen den Menschen identifizierbar.


Na klar. Aber das war doch zumindest den Technikern von Anbeginn an klar. Wie soll der kleine – auf Strom sparen ausgelegte – Chip in den Smartphones diese  Rechenleistung auch erbringen? Spracherkennung ist eine ziemlich diffizile Sache, bei der Signalprozessoren unabdingbar sind. Und das geht definitiv nicht mit dem Handy. Und auch nicht ohne Autobatterie am Handgelenk.

Wie funktioniert das denn generell?

Das Handy nimmt den Sprachbefehl als Audiomitschnitt auf und sendet ihn an die dafür vorgesehenen Server. Dort wird der Sprachfetzen überarbeitet, von Störgeräuschen befreit und auf mögliche Übereinstimmungen mit vorgesehenen Befehlen verglichen. Die dann gefundenen Möglichkeiten werden als Befehlsfolge an das Handy zurückgegeben, das dann die Befehle ausführt und/oder kommentiert.

Damit wäre dann wohl auch klar, warum die Spracherkennung einfach nie funktioniert, wenn man kein Datennetz hat.

Und wo ist jetzt das Problem?

Es ist wie immer. Wo viel Licht ist, ist viel Schatten. Denn erst einmal wird die Stimme des Nutzers auf fremde Server übertragen. Und natürlich kann man da etwas mit machen. So kann man im positiven Ansatz die Software lernen lassen und sie so verbessern. Das führt dann dazu, dass manche Sprachsteuerung sogar den Befehl erkennt, wenn man nachts um vier Uhr einmal nicht so ganz klar artikuliert spricht. Also ganz sinnvoll für manchen, der nach durchzechter Nacht schnell ein Taxi zum Hotel braucht.

Aber man könnte diese Sprachfetzen auch nutzen, um einen Nutzer bei Telefonaten wiederzuerkennen. Und das ist dann eine durchaus realistische Gefahr. Wer weiß denn schon, was der Smartphone-Anbieter für Abkommen mit Dritten oder einem Geheimdienst hat? Muss nicht sogar ein U.S. Unternehmen diese Daten den Geheimdiensten zur Verfügung stellen? Ist doch bei anderen Daten auch so. Leider kann das zur Zeit niemand verbindlich sagen.

Also bleiben im Extrem nur zwei Ansätze. “Et hät no ever jot jejange” oder “Abschalten. Jetzt”.

Welcher Weg der Richtige ist, muss jeder für sich selbst entscheiden. Da gibt es kein Patentrezept. Aber man sollte auf jeden Fall einmal darüber nachdenken. Denn im Grunde gibt es zwischen den beiden Extrempunkten keine Graustufen. Wer seine Stimme nicht auf fremden Servern haben will, hat nur eine Möglichkeit: Spracherkennung aus.

Hinterlasse eine Antwort

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind markiert *

Du kannst folgende HTML-Tags benutzen: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>


Autorenprofil bei Google

IT-Beratung mit dem Blick über den Tellerrand

Wissen rund um SocialMedia und Web 2.0.


Seit 1990 im Ruhrgebiet beratend tätig. Die Kunden stammen aus den verschiedensten Bereichen. Vom kleinen Grafikbüro bis zum mittelständischen Maschinenbauer sind Unternehmen verschiedener Größen und Arbeitsgebiete vertreten.
Im Mittelpunkt ist immer das beratene Unternehmen. Es werden keine Produkte sondern Lösungen empfohlen.
Bei Interesse stehe ich gerne auch persönlich zur Verfügung.