Google Translate (GT) ist definitiv die beste und meistgenutzte Übersetzungssoftware der Welt. Es unterstützt bis zu 103 Sprachen, 10.000 Sprachpaare und verarbeitet täglich bis zu 500 Millionen Übersetzungen. Experten prognostizieren, dass das neuronale System von GT bald neben Texten auch Audio- und Videodateien verarbeiten kann.
Google Übersetzer seit 2016 nutzt es das Neural Machine Translation System (GNMT). Ein System, das auf einem künstlichen neuronalen Netz basiert, ist die Übersetzungsqualität erheblich verbessert. Seitdem sind drei Jahre vergangen, und jetzt können wir seine Wirksamkeit beurteilen. Hat sich die Qualität der Übersetzungen wirklich verbessert und was muss noch geändert werden, damit sie sich verbessert?
Wie funktioniert der Google Translate-Algorithmus überhaupt?
Google Übersetzer sind 2006 entwickelt und arbeitete zunächst mit Hilfe statistische Methoden der maschinellen Übersetzung. Das heißt, er hat Milliarden und Abermilliarden Wörter in seinem Programm gespeichert. Beim Übersetzen wählte er einfach die am besten geeigneten oder beliebtesten Entsprechungen beider Sprachen aus und schrieb sie aus. Google bei der Erstellung des Übersetzers verwendet Dokumente der Vereinten Nationen (Englisch, Arabisch, Französisch, Chinesisch, Russisch und Spanisch) und produzierte so ein Korpus von sechs Weltsprachen mit etwa 20 Milliarden Wörtern. Dieser Prozess war langsam, ungenau und verbrauchte viel Rechenleistung.
Heute verwendet Google Translate die sog Deep-Learning-Methode (Deep Learning Method), bei dem ein großes künstliches neuronales Netz besonders wichtig ist.
Bevor Google anfing, neuronale Netze zu verwenden, war die Übersetzung Wort für Wort. Das System übersetzte problemlos jedes Wort einzeln und befolgte dabei die grundlegenden Grammatikregeln. Daher war die Qualität der Übersetzung sehr fragwürdig.
Allerdings mit dem neuen, neuronalen Übersetzungsmodell die grundlegende Übersetzungseinheit ist nicht mehr ein Wort, sondern nur noch ein Teil eines Wortes. Somit konzentriert sich die Übersetzung nicht auf Wortformen, sondern auf Kontext und Bedeutung des ganzen Satzes. Das Programm übersetzt daher den Satz als Ganzes gemäß seiner kontextuellen Bedeutung, ohne Hunderte von möglichen Übersetzungsversionen in seinem Speicher zu speichern.
Die Software übersetzt daher den gesamten Satz unter Berücksichtigung des Kontexts und konzentriert sich nicht mehr nur auf einzelne Wörter. Es speichert nicht Hunderte von Übersetzungsversionen in seinem Speicher. Stattdessen arbeitet es mit der Semantik des Textes und unterteilt Sätze in Wörterbuchsegmente.
Wie übersetzt Google mithilfe eines neuronalen Netzes?
Heute verwendet er Google Translate etwa 32.000 solcher Fragmente. Mit Hilfe einzelner Decoder ermittelt es zunächst die Bedeutung jedes Textteils. Es berechnet dann die maximal mögliche Anzahl von Bedeutungen und möglichen Übersetzungen. Schließlich kombiniert es die übersetzten Segmente mit Grammatikregeln. Laut den Entwicklern ist dieser Ansatz ermöglicht eine hohe Übersetzungsgeschwindigkeit und -genauigkeit ohne übermäßige Rechenleistung zu verbrauchen. Da aber jede Sprache ihre eigenen Regeln (semantisch und grammatikalisch) hat, benötigt Google Translate auch für jede Sprache spezielle Module und Wörterbücher, die in eigenen Algorithmen implementiert sind.
Zwischensprache
Künstliche Intelligenz, die von Google Translate als verwendet wird Zwischensprache, heißt Interlingua. Diese universelle Computersprache ist natürlich für die menschliche Kommunikation völlig ungeeignet. Künstliche Intelligenz wird in der Übersetzung eingesetzt, wo sie als Zwischensprache mit eingesetzt wird es kann auch in und aus Sprachen übersetzen, für die es nicht erstellt wurde.
Der Vorteil des neuronalen Netzes besteht darin, dass es mit einer größeren Anzahl von Sprachpaaren arbeiten kann, auch mit solchen, die nicht in den ursprünglichen Lernprozess einbezogen wurden. Wenn das System beispielsweise darauf trainiert wurde, die Sprachpaare Englisch-Japanisch und Englisch-Koreanisch zu übersetzen, kann es auch das Sprachpaar Japanisch-Koreanisch problemlos übersetzen, ohne Englisch als Zwischensprache zu verwenden.
Die von Google implementierte Übersetzungsmethode, die die Entwickler Zero-Shot-Translation nennen, ist ausgeklügelter und setzt bei der Übersetzung auf eine künstliche Zwischensprache. Dieses Forschungsgebiet entwickelt sich sehr schnell, und bald werden diese Übersetzungssysteme zum wichtigsten Übersetzungswerkzeug. Es ist ein System selbst erlernt - verbessert seine Kenntnisse selbst und kann auch Slang und Slangwörter, Neologismen und andere Wörter, die nicht in allgemeinen Wörterbüchern enthalten sind, richtig übersetzen.
Sprachpaare
Das GNMT-System hat die Übersetzung der am häufigsten verwendeten Sprachpaare stark verbessert: Spanisch-Englisch und Französisch-Englisch. Die Korrektheit der Übersetzungen stieg auf bis zu 85%.
2017 führte Google eine Umfrage unter regelmäßigen Nutzern des Übersetzers durch. Sie wurden gebeten, drei Übersetzungsoptionen zu bewerten: maschinell statistisch, neuronal und menschlich. Die Ergebnisse waren beeindruckend – Die Übersetzungen des neuronalen Netzes waren bei einigen Sprachpaaren nahezu perfekt.
Es ist offensichtlich, dass die Qualität der Übersetzungen in den Sprachpaaren Englisch-Spanisch und Französisch-Englisch fast die gleiche ist wie bei Humanübersetzungen. Diese Tatsache ist nicht überraschend, da diese Sprachpaare für das Deep Learning der Google Translate-Algorithmen verwendet wurden. Anders sieht es bei anderen Sprachpaaren aus. Wenn jedoch die neuronale Übersetzung zwischen strukturell ähnlichen Sprachen vergleichbar funktioniert, wird die Computerübersetzung für Sprachpaare, bei denen die Sprachsysteme radikal unterschiedlich sind, viel schlechter sein.
Was sind die Nachteile von Google Übersetzer?
Es stimmt, dass Google Translate sehr praktisch ist und durch seine Zugänglichkeit und schnelle Bedienung im Übersetzungsalltag hilfreich ist. Allerdings fehlt ihm noch etwas Wesentliches – Verstehen. Bei der Computerübersetzung geht es nie um das Verstehen. Die Entwickler des Programms versuchten, die Entschlüsselungsmethode zu verbessern, oder anders gesagt, sie versuchten, die Übersetzungsmaschine mit ihren analytischen Fähigkeiten dazu zu bringen, damit umzugehen. Sie mussten jedoch gefunden werden Balance zwischen Übersetzungsgenauigkeit und Geschwindigkeit.
Eliza-Effekt
Für jede Maschine, jedes Computergerät oder jede Software sind Worte wichtig. Allerdings können Maschinen die tiefe Bedeutung von Wörtern noch nicht erfassen.
Jahre 1960 Sie stellten Eliza her, ein mechanisches Gerät, das eine Reihe von Antworten manipulierte und den Eindruck erweckte, dass es tatsächlich intelligente Sätze erzeugte. Von da an wurde die Frage benannt, ob Maschinen wie Menschen denken können Eliza-Effekt.
Der Eliza-Effekt beeinflusst KI-Forscher und Softwareentwickler seit Jahrzehnten. Die meisten Benutzer von Google Translate glauben, dass dieses Programm zumindest manchmal die Bedeutung von Wörtern verstehen kann. Dies ist jedoch nicht wahr - Google Translate versteht die Sprache nicht, schafft es aber manchmal trotzdem, Sätze zu bilden, die ziemlich gut klingen. Manchmal schafft es es sogar, ein oder zwei Absätze perfekt zu übersetzen, und wir glauben fast, dass das Programm die Sprache tatsächlich versteht. Wir dürfen jedoch nicht vergessen, dass Google Translate nicht in der Lage ist, wie ein Mensch zu denken und Texte nur auf eine bestimmte Weise verarbeiten kann. Ein Computerprogramm hat kein Gedächtnis, keine Vorstellungskraft und kein Verständnis für die verborgenen Bedeutungen von Wörtern.Es gibt also keinen Grund, nicht zu glauben, dass Computer eines Tages in der Lage sein werden, wie Menschen zu denken.
Es wird jedoch erwartet, dass sie in der Lage sind, hervorragende Übersetzungen zwischen verschiedenen Sprachen durchzuführen. Es ist sehr wahrscheinlich, dass sie es eines Tages tun werden Witze, Kurzgeschichten, Gedichte und Essays übersetzen können. Schließlich entwickelt sich die Technologie mit Lichtgeschwindigkeit.
Mehr Informationen:
translate.google.com