Sprachsteuerung beim Smartphone

„Hey, Siri, brauche ich einen Regenschirm?“

Ein Sprachassistenzsystem wird in eine Steckdose gesteckt.

Google Now, Siri und Cortana – diese Namen haben etwas gemeinsam. Sie alle stehen für digitale Assistenten auf dem Smartphone, mit denen man „reden“ kann. Gerade an kleineren Geräten kann die Sprachsteuerung sehr praktisch sein, um eine Sucheingabe oder eine Nachricht zu diktieren. Auf welchen Geräten man diese Assistenten findet, in welchen Fällen sie nützlich sein können und welche Nachteile sie haben, zeigt dieser Artikel auf.

In erster Linie sind Siri, Google Now und Cortana Sprachsteuerungen. Mit ihnen lassen sich bestimmte Funktionen im Telefon allein mit der Stimme anwählen. Beispiele für Sprachbefehle können sein: „Stelle den Wecker für morgen auf 6.30 Uhr“ oder die Aufforderung, einen Kontakt aus dem Adressbuch anzurufen oder einen Terminkalendereintrag anzulegen. Auch eine SMS kann so diktiert werden, wenn das händische Eintippen zu mühselig ist.

Je nach Betriebssystem des Smartphones heißt der digitale Assistent anders:

  • Apple bringt ab iOS 5 für die meisten Geräte Siri mit sich, die sich über die Home-Taste starten lässt.
  • Android-Geräte brauchen eine Betriebssystemversion höher als 4.1, um Google Now zu nutzen.
  • Windows Phones kommen ab Version 8.1 mit Cortana daher.
  • Auf Samsung Smartphones ist zusätzlich noch S Voice installiert.

Mehr als nur Sprachsteuerung

Die drei Assistenten „verstehen“ aber noch mehr: „Brauche ich heute einen Regenschirm?“ wird von den meisten Programmen zuverlässig interpretiert: Der Besitzer oder die Besitzerin fragt nach dem Wetter und interessiert sich für die Regenwahrscheinlichkeit am aktuellen Tag. Auch auf eine Frage wie „Wo ist die nächste Tankstelle“ geben Siri und Co. Antwort. Im Idealfall ist dafür GPS, also die Satellitenortung des Telefons eingeschaltet. Diese Information nutzen die Programme, um eine Route vom aktuellen Standort zur nächsten Tankstelle zu berechnen und anzuzeigen.

Viele Dinge werden natürlich auch nicht verstanden oder nur mit Suchergebnissen beantwortet. Computer Bild zeigt in dem Video „Sprachsteuerung von Smartphones im Test“ wie die Sprachsteuerung funktioniert. Apples Assistentin Siri wurde vor allem für ihren „Smalltalk“ bekannt, auf YouTube finden sich Videos, die die lustigen Antworten provozieren.

Die technische Seite

Damit Siri, Cortana und Google Now reagieren, muss man sie erst per Tastendruck aktivieren oder „ansprechen“: je nach Programm mit „hey Cortana“, „hey Siri“ oder „okay Google“. Dann kann man dem Gerät seine Aufforderung oder Frage mitteilen. Rein technisch passiert dabei Folgendes: Das eingebaute Mikrofon nimmt die Sprache auf und sendet diese Daten genauso wie Informationen zum Beispiel zu Standort und Uhrzeit über die Internetverbindung des Smartphones an einen Server, wo die Daten maschinell interpretiert werden. Die meisten Programme reagieren auf Schlüsselwörter wie „anrufen“, „Wetter“, „Termin“.

Beispiele für Befehle an den digitalen Assistenten:

  • Wie lange brauche ich nach Ludwigshafen?
  • Lege für morgen um 10 Uhr einen Termin fest.
  • Weck mich morgen um 6 Uhr.
  • SMS an Erika Mustermann, komme fünf Minuten später.

Die Vorlieben der Besitzer kennenlernen

Damit diese Assistenten so gut funktionieren, lernen die Programme unbemerkt im Hintergrund stets dazu. Sie merken sich beispielsweise, wo ihre Besitzerin oder ihr Besitzer sich häufig aufhalten und welche Suchanfragen gemacht wurden. Auf dieser Grundlage können dann auch individuell Informationen und Vorschläge geliefert werden. Interessiert man sich zum Beispiel für ein bestimmtes Film-Genre und hat dazu schon öfter Suchanfragen gestellt, melden sich der digitale Assistent, sobald ein neuer Film aus diesem Genre ins Kino kommt. Sagt man zu Siri beispielsweise: „Ruf meine Tochter an“, fragt Siri zurück: „Wie heißt deine Tochter?“. Bekommt sie diese Information, speichert sie für die Zukunft, wer bei „Tochter“ anzurufen ist.

Daten, Daten, Daten

So praktisch diese digitalen Assistenten sein mögen, sie haben einen Nachteil: Sie erheben eine Menge Daten über ihre Benutzerinnen und Benutzer. Damit das Wetter am aktuellen Ort angezeigt werden kann, muss der Standort erfasst und mitprotokolliert werden. So wissen die Unternehmen hinter den Programmen immer, wo ihre Nutzerinnen und Nutzer sich wie oft aufhalten, wo sie gerne einkaufen, wo sie schlafen und wie oft sie ins Fitnessstudio fahren. Damit auf den entsprechenden Sprachbefehl reagiert werden kann, muss das Gerät auch entsprechend ständig „zuhören“. Gespräche werden auf diesem Weg jedoch nicht mitgeschnitten, versichern die Betreiber.

Fazit

Ob man die digitalen Assistenten wirklich nutzen möchte, bleibt jedem selbst überlassen. In den meisten Geräten muss man Siri, Cortana und Google Now vor der ersten Nutzung erst aktivieren. Und auch eine nachträgliche Deaktivierung der Funktion ist möglich. Anleitungen dazu findet man im Internet speziell für das eigene Gerät.

Dieser Artikel gibt den Sachstand zum Zeitpunkt der Veröffentlichung wieder. Datum: 15. Februar 2016