KI-Programm übersetzt erstmals alle rätoromanischen Sprachvarianten
Wirtschaft
28. April 2026

KI-Programm übersetzt erstmals alle rätoromanischen Sprachvarianten

Das «Alas» genannte Modell sei das erste, das die Romanische Idiome unterstütze, teilte die Universität Zürich (UZH) am Dienstag mit.

Romanisch hat fünf regionale Idiome: Sursilvan, Sutsilvan, Surmiran, Puter und Vallader. Zusätzlich gibt es mit Rumantsch Grischun eine überregionale Schriftsprache. Offizielle Texte liegen häufig in Rumantsch Grischun vor. Im Alltag und in der Schule werden hingegen meist die lokalen Idiome verwendet. Für KI-Systeme ist diese Vielfalt eine besondere Herausforderung.

Während KI-Assistenten wie ChatGPT die Schriftsprache Rumantsch Grischun bereits zu einem gewissen Grad beherrschen, hatten sie bei den regionalen Varianten bisher grosse Mühe. Auf Initiative der Lia Rumantscha, des Dachverbands der romanischen Sprachvereine, entwickelte ein Forschungsteam der Universität Zürich nun ein KI-Modell, das mit diesen Varianten umgehen kann.

Muttersprachler überprüfen Resultate

«Alas» wurde dafür gezielt auf die romanischen Idiome trainiert. Zu den Trainingsdaten gehörten unter anderem Beiträge des rätoromanischen Radios und Fernsehens RTR, Zeitungsartikel, literarische Texte, Schulbücher sowie Dokumente von Gemeinden und dem Kanton Graubünden.

In einem Blindvergleich mit Muttersprachlerinnen und Muttersprachlern wurden die Ergebnisse überprüft. «Der Blindvergleich hat uns bestätigt, dass ‹Alas› deutlich bessere Übersetzungen produziert als bestehende KI-Assistenten», wird Jannis Vamvas von der Universität Zürich zitiert. Die Übersetzungen seien inhaltlich genauer und idiomatischer. Nur von Menschen angefertigte Übersetzungen schnitten noch besser ab.

Das Übersetzungsprogramm «Alas» steht der Öffentlichkeit gratis auf einer Webseite zur Verfügung. Das zugrundeliegende KI-Modell ist zudem als Open-Source-Software zugänglich. Fachleute können es damit prüfen und weiterentwickeln. Romanisch wird von rund 100’000 Menschen in verschiedenen Varianten gesprochen.