Die eigene Stimme ist zwar unverwechselbar, eignet sich aber trotzdem nicht als Passwortschutz. Die Spracherkennung von Smartphones lässt sich ziemlich leicht mit Computerimitationen austricksen.

Ein kanadisches Startup hat vor einem Jahr ein Programm vorgestellt, mit dem sich spielend leicht Stimmen imitieren lassen. Nur eine Minute der Stimmen von Donald Trump oder Barack Obama reichten aus, um mit Hilfe von künstlicher Intelligenz zu berechnen, wie Sätze klingen würden, die die beiden so nie gesagt haben. Ob die Qualität allerdings ausreicht, um ein Sprachsystem zu überlisten, ist fraglich.

Zwei amerikanische Sicherheitsforscher ist das mit einer anderen Methode aber gelungen. Sie warnen deshalb auf der Hacker-Konferenz Def Con davor, die eigene Stimme als Passwortschutz für das Smartphone zu nutzen. Denn eigentlich sollen Systeme wie Apples Siri zum Beispiel nur auf die Stimme des Smartphone-Besitzers reagieren, wenn diese als Passwortschutz genutzt wird. Doch die Forscher haben Siri mit einer künstlichen Stimme ausgetrickst.

Zehn Minuten Sprachaufnahme reichen

Bislang benötigte man 24 Stunden Material in möglichst guter Qualität, um eine künstliche Stimme zu entwickeln, die Spracherkennungssoftware austricksen kann. Jetzt sagen die Forscher, dass ihnen Aufnahmen mit insgesamt zehn Minuten reichen, um die perfekte Stimmenimmitation zu erstellen. 

Dazu wurden die Aufnahmen in Sprachfetzen von zehn Sekunden zerschnitten, um das System damit zu trainieren. Nach diesem ersten Training wurden die Proben mit einer Software künstlich beschleunigt oder verlangsamt, um das Ergebnis noch zu verfeinern. So sind am Ende 300 Minuten Material entstanden.

"Mit diesem Ergebnis ließ sich nicht nur Siri überlisten, sondern die Forscher bekamen auch Zugang zu Microsofts Cloud-Diensten."
Andreas Noll, Deutschlandfunk Nova Netzreporter

Die Erzeugung künstlicher Stimmenimmitationen werden in Zukunft wohl noch schneller und noch besser werden. Einen Bankaccount per Stimmpasswort zu schützen, wie das in den USA schon von einigen Anbietern gemacht wird, ist deshalb keine gute Idee. 

Auch Google benutzt im Übrigen bereits künstliche Stimmen, um zum Beispiel Termine beim Arzt oder Friseur zu machen. Dazu benötigt der Computer-Assistent lediglich Zugriff auf den Kalender und Termine. Bei Tests haben die Personen am anderen Ende der Leitung gar nicht bemerkt, dass sie mit einer Maschine telefoniert hat.

Mehr zum Thema bei Deutschlandfunk Nova:

Shownotes
Spracherkennung
Stimme ist kein sicherer Passwortschutz
vom 16. August 2018
Moderation: 
Till Haase
Gesprächspartner: 
Andreas Noll, Deutschlandfunk Nova