Sächsisch, Hessisch oder Rheinisch -

für Menschen aus ganz anderen Regionen Deutschlands sind Dialekte oft schwer zu verstehen. Aber auch KI tut sich schwer. Das berichten Forschende der Uni München und der Bayrische Rundfunk. Die haben drei Spracherkennungsprogramme getestet. Die Software sollte mehrere Stunden Radiosendungen in einen Text transkribieren. Die Sendungen waren auf Bairisch, Fränkisch und Schwäbisch und sollten auf Hochdeutsch übersetzt werden. Zum Vergleich transkribierten die Programme auch noch eine Sendung, die schon auf Hochdeutsch war.

Dabei machten die Spracherkennungsprogramme deutlich mehr Fehler bei den Dialekten. Selbst die beste Software leistete sich rund 30 Prozent Fehler bei der Worterkennung - im Vergleich zu neun Prozent bei der hochdeutschen Sendung. Durch ein falsches Wort ging oft schon der gesamte Sinn des Satzes verloren.

Die Forschenden wollen die Spracherkennungsprogramme jetzt gezielt mit den Dialekt-Sendungen des Bayrischen Rundfunks trainieren - damit sie in Zukunft besser abschneiden.