"He, Nudlaug!" - Computer lernt Wienerisch

(c) Bonus Film

Forscher aus Wien haben den Wiener Dialekt synthetisiert. Um sprechen zu können, greift der Rechner auf fertige Sprachbausteine zurück. Diese wurden vorher von Sprechern wie Hanno Pöschl eingelesen.

"He, Nudlaug, wos is?" - Die Zeit der ausschließlich höflichen und geziert hochdeutsch sprechenden Computerstimmen ist zu Ende. Wissenschafter haben in einem interdisziplinären Projekt unter der Leitung des Forschungszentrums Telekommunikation Wien (ftw) dem Computer nun Wienerisch beigebracht. Hinter "He, Nudlaug, wos is" versteckt sich nichts anderes als eine sogenannte Eingabeaufforderung, erfuhr man einer Präsentation des Forschungsprojekts am Donnerstag in Wien.

Sprache in Einzelteile zerlegt

Die Technologen haben dabei verschiedene Varianten des Wienerischen kreiert und dafür unter anderem Schauspieler und Moderatoren wie Hanno Pöschl, Helma Gautier oder Stephan Pokorny gleichsam als Stimmenspender gewonnen. Diese mussten jeweils mehrere Stunden einfache Redewendungen bis hin zu Gedichten von H. C. Artmann vortragen. Im Computer werden die Aufnahmen dann in kleinste Einheiten der Sprache, sogenannte Phoneme, zerlegt und daraus eine Datenbank angelegt.

Computer kann mehrere Dialekte

Für die Synthese der Sprache greift die Maschine dann blitzschnell auf die Bausteine der Datenbank zurück. Neben dem klassischen Wienerisch, für dass Pöschl seine Stimme zur Verfügung stellte, entstanden so auch eine Art österreichisches Hochdeutsch (Pokorny), eine Wiener Standardsprache (Gautier) und eine Jugendsprache.

Computer kann Dialekt selbst anpassen

Die Forscher haben in Zusammenarbeit mit dem Österreichischen Forschungsinstitut für Artificial Intelligence (ÖFAI), dem Institut für Schallforschung (ARI) und dem Centre for Speech Technology in Edinburgh (Großbritannien) einen neuen Ansatz gewählt. Bei der sogenannten adaptiven Sprachsynthese bedarf es keiner menschlichen Paten mehr, der Computer selbst ahmt sämtliche Aufgaben von Kehlkopf, Mund und Zunge nach. "Dabei ist es sogar möglich, die Intensität des Dialekts stufenlos zu verstellen", erklärte Projektleiter Michael Pucher vom ftw.

"Was hams g'sagt?"

Derzeit laufen Gespräche, eine Stimme der gesprochene Version in ein kommerzielles Produkt umzuwandeln, so Pucher. Es soll sich um ein Dialogsystem handeln, das etwa als Restaurant- oder Fremdenführer einsetzbar ist. In Zukunft könnte es daher nicht mehr heißen "Eingabe nicht zulässig, bitte wiederholen" sondern "T'schuldigung, was hams g'sagt?" - wenngleich noch etwas abgehackt und computerartig.