- für das Projekt Common Voice. Bisher hat Mozilla so fast 1400 Stunden an Sprachaufnahmen gesammelt. Und die stellt die Organisation jetzt allen zur Verfügung, die was mit Sprache machen wollen - also zum Beispiel kleinen Unternehmen, Forschenden oder Crowdfunding-Projekten, die eine eigene Spracherkennungssoftware entwickeln wollen.

Das ist vor allem für Sprachen spannend, für die sich große kommerzielle Unternehmen bislang nicht interessieren. In der Datenbank sind inzwischen 18 Sprachen - und zwar nicht nur Englisch, Deutsch oder Mandarin, sondern auch Walisisch, Tatarisch oder Kabylisch. Das ist eine Sprache aus Nordafrika.

Die Sprachdaten sind unter der "CC0"-Lizenz verfügbar. Das ist die freigiebigste Variante der Creative-Commons-Lizenzen. Die Projekt-Teilnehmenden haben dabei freiwillig auch Zusatzinfos über sich gegeben wie Alter, Geschlecht und Akzent.