Schnellauswahl

Maschinen übersetzen Sprachen - die Anfänge des NLP

Shutterstock
  • Drucken

Bereits seit Anfang der 1950er-Jahre wird an Maschineller Übersetzung geforscht – mit einigen Höhen und Tiefen.

Nur sechs Jahre nach der Entwicklung des ersten Computers (1942) wird der Grundstein für die Entwicklung von automatisierten Übersetzungssystemen gelegt. Andrew Dondald Booth, Leiter des Rechenzentrums der Universität London, und Warren Weaver, Vizepräsident der Rockefeller Foundation, stellen 1948 ihr erstes Versuchssystem vor, das erstmals nicht auf einer reinen Wort-zu-Wort-Übersetzung basiert. Vielmehr werden Wortstämme und Flexionsformen in getrennten Lexika verglichen, um Satzstellungen zu analysieren und einen Text in einer anderen Sprache zu erstellen. Eine revolutionäre Idee, von der die breite Öffentlichkeit kaum Notiz nimmt. Die Wissenschaft wird hingegen hellhörig.

Pionier und Totengräber.

Als 1951 Jehoschua Bar-Hillel, Philosoph, Mathematiker und Linguist an der Hebräischen Universität Jerusalem, am Massachusetts Institute of Technology (MIT) zum ersten ausschließlich für Maschinelle Übersetzung (MÜ) zuständigen Forscher berufen wird, kommt der Stein ins Rollen. Bei der 1952 von Bar-Hillel am MIT organisierten weltweit ersten MÜ-Konferenz nehmen nahezu alle auf diesem Gebiet tätigen Wissenschaftler teil. Auf der Agenda stehen die Vor- und Nachbearbeitung von Texten, elektronische Wörterbücher und Syntaxanalysemodelle. In der Folge entwickelt Léon Dostert von der Georgetown University in Kooperation mit IBM ein Übersetzungssystem, das er 1954 präsentiert. Erstmals wurde auf Basis von 250 Lexikoneinträgen und lediglich sechs Grammatikregeln eine vollautomatische Übersetzung erstellt, vom Russischen ins Englische. Die Begeisterung ist groß, die MÜ-Forschung wird noch in den 1950er-Jahren in die amerikanische Regierungsförderung aufgenommen, rund 20 Millionen Dollar werden in den Folgejahren investiert. 1960 folgt die Ernüchterung. Es ist Dostert selbst, der die aufkommende, nun auch öffentlich wirksame Euphorie bremst. Enttäuscht von unerwarteten und scheinbar unüberbrückbaren Komplikationen in seinem ureigenen Forschungsgebiet schreibt Dostert in einem Bericht, dass eine hochqualitative maschinelle Übersetzung von Texten nicht nur in naher Zukunft unmöglich sei, sondern niemals erreicht werden könne.

Léon Dostert 1953
Léon Dostert (1953)Georgetown University Library

Neustart mit lernenden Algorithmen.

Die MÜ-Forschung gerät in Vergessenheit und es dauert bis in die späten 1980er-Jahre, um neue Hoffnung zu schöpfen. Machine Learning wird populär, Computer verfügen über immer größere Rechenkapazitäten. Algorithmen werden entwickelt, die für Natural Language Processing nutzbar sind. Dass 30 Jahre später NLP-basierte Computerprogramme Textkörper und sogar gesprochene Sprache erkennen und analysieren werden – davon wagt man freilich noch nicht zu träumen.