Künstliche Intelligenz, neuronale Netze, maschinelles Lernen - Google fährt ganz schön auf. Und wofür? Um Vogelstimmen zu erkennen.

Für Musik gibt's Shazam-App, für Vogelstimmen gibt's die Vogelstimmen ID und den Zwitschomaten. Das Problem: Während Shazam selbst bei Covern von Musikstücken ganz gut funktioniert, haben die Vogelstimmen-Apps so ihre Probleme. Dabei sind die Apps mit 4,99 Euro gar nicht mal so günstig. Dahinter steckt allerdings auch jede Menge Technik, denn es ist gar nicht so einfach, Vogelstimmen zu erkennen.

Denn zum einen singen Vögel gerne zu mehreren und durcheinander. Zum anderen sind sie nicht annähernd so melodietreu wie die Musiker und bauen immer wieder Variationen in ihren Gesang ein. Das macht es bislang ganz schön schwierig und die Bewertungen in den App-Stores klingen nicht immer begeistert. 

Zwitscher-Fragmente statt kompletter Melodie

Genau in die Lücke will jetzt Google stoßen. Unter Aixperiments sind jede Menge Vogelstimmen gesammelt und als Sonogramme dargestellt. Die schwarzen Wellenlinien sehen aber nicht aus, wie die glatten Waveformen in Musikprogrammen, sondern eher, als hätte jemand mit dem Bleistift gekritzelt.

Was Googles KI anders macht: Sie zerlegt diese Sounds in kleine Fragmente. Diese Entscheidung - und das ist das Besondere - hat die Software selber getroffen. Dahinter versteckt sich nämlich eine selbstlernende Künstliche Intelligenz.

Auf der Seite sind verschiedene Vogelstimmen-Sonografien zu sehen
© Screenshot Macaulay Library | Cornell Lab for Ornithology
Über 200.000 Vogelstimmen sind als Sonogramme in der Macaulay Library des Cornell Lab for Ornithology gesammelt

Die Google-Entwickler arbeiten zusammen mit dem Cornell Lab for Ornithology. In deren Macaulay Library sind aktuell eine Viertelmillion Tierstimmen gespeichert, die meisten davon Vogelgesänge. Das Experiment soll im besten Fall zu einer Vogelstimmen-App führen, die wesentlich präziser ist als das, was bisher auf dem Markt ist. 

Shownotes
Künstliche Intelligenz
Mit KI auf Spatzen
vom 19. Juni 2017
Moderation: 
Till Haase
Autor: 
Michael Gessat