Roboter träumen vielleicht nicht, aber sie halluzinieren. Da künstliche Intelligenz in letzter Zeit im Rampenlicht der Medien steht, ist die Tendenz der algorithmusbasierten Technologie, Material zu „halluzinieren“, zu einem Hauptanliegen beim Einsatz von KI geworden, und dies gilt auch für den Bereich der maschinellen Übersetzung.
In diesem Beitrag untersuchen wir, was Halluzinationen bei maschineller Übersetzung sind, warum sie auftreten und wie Sie verhindern können, dass dieses ernste Problem Ihre potenziellen Übersetzungsprojekte beeinträchtigt.
Was sind Halluzinationen bei der maschinellen Übersetzung?
Bei der maschinellen Übersetzung wird im Gegensatz zur menschlichen Übersetzung Computersoftware – in der Regel künstliche Intelligenz oder Lösungen für maschinelles Lernen – verwendet, um Texte von einer Sprache in eine andere zu übersetzen. Während maschinelle Übersetzung dabei helfen kann, Zeit und Geld zu sparen, können diese Maschinen leider auch Halluzinationen hervorrufen: Übersetzungsergebnisse, die in keinerlei Zusammenhang mit dem ursprünglichen Text stehen (und oft bizarr sind).
Ein Experiment mit maschineller Übersetzung ergab beispielsweise, dass das verwendete Modell völlig neue Geschichten halluzinierte. Der ursprüngliche Satz war eine Aussage über einen anhaltenden Streik in Kolumbien. Nachdem der Satz zunächst mit Google Translate nach Marathi übersetzt wurde und dann vom maschinellen Übersetzer wieder zurück ins Englische, wurde er zu einer völlig falschen Aussage über US-amerikanische Kinder, die bei den Zeugen Jehovas dienen. Wie dieses Beispiel zeigt, können Halluzinationen besonders häufig auftreten, wenn aus dem Englischen in weniger häufig verwendete Sprachen übersetzt wird, über die die Maschine möglicherweise nicht so viele zuverlässige Daten hat.
Warum kommt es zu Halluzinationen?
Einige Halluzinationen der neuronalen maschinellen Übersetzung (NMT) werden durch eine „Eingabestörung“ oder ein unerwartetes Element der Eingabe verursacht, das folglich die Ausgabe verfälscht. Die Eingabe könnte einen Tippfehler, einen eigenartigen Stil, ein ungewöhnliches Wort oder ein Wort enthalten, das im Modell einfach nicht erfasst wird.
Andere Halluzinationen sind auf zugrunde liegende Probleme mit den Daten zurückzuführen, die zum Trainieren des Modells verwendet wurden. Forscher haben beispielsweise herausgefunden, dass einige Modelle Probleme mit dem übermäßigen Auswendiglernen von Phrasen haben, d. h., Phrasen werden so von der Maschine auswendig gelernt, dass sie diese Phrasen jedes Mal genau so wiederholen möchte, ohne den Kontext oder die Ausdrucksweise zu berücksichtigen. Ein hohes Maß an „Rauschen“ im Körper der Trainingsdaten – zu viele fehlerhafte oder falsch ausgerichtete Paare zwischen Ausgangs- und Zielsätzen – kann ebenfalls zu Halluzinationen führen.
Und wenn es um LLM-basierte Modelle wie ChatGPT geht, ist die Lage ebenso besorgniserregend. Zusätzlich zu danebengegangenen Übersetzungen und Übersetzungsfehlern oder -problemen können Trainingsdaten auch schädliches Material enthalten, das sich in das Ergebnis der Übersetzung einschleicht.
So vermeiden Sie Halluzinationen bei Übersetzungen
Wie Sie sich vorstellen können, können Halluzinationen bei maschineller Übersetzung für ein Unternehmen katastrophal sein, das Vertrauen der Benutzer untergraben und schwerwiegende Sicherheitsbedenken hervorrufen. Es gibt zwar Möglichkeiten, die Maschinen selbst feinabzustimmen, aber die einzige bewährte Methode, Halluzinationen zweifelsfrei zu beheben, ist der menschliche Eingriff – ein echter, professioneller menschlicher Übersetzer.
Die Verwendung menschlicher Übersetzungen bedeutet nicht, dass Sie maschinelle Übersetzungen nicht als ersten Schritt in einem Großprojekt verwenden können. Stattdessen können Sie einen menschlichen Übersetzer beauftragen, den „ersten Entwurf“ der maschinellen Übersetzung in einem als Post-Editing bezeichneten Prozess zu bereinigen. Posteditoren überprüfen und korrigieren Ihre maschinellen Übersetzungen nicht nur und polieren sie auf einen hohen Standard, sondern ihre Neuübersetzungen können auch in den Speicher der Maschine selbst integriert werden, wodurch ihr „Training“ für zukünftige Projekte verbessert wird.
Um die besten Ergebnisse zu erzielen, sollten Sie sich an professionelle Linguisten wenden, die speziell für das Post-Editing maschineller Übersetzungen ausgebildet sind, wie beispielsweise unsere erfahrenen Posteditoren bei Trusted Translations, die einen strengen Prozess befolgen, um die Qualität jeder Übersetzung sicherzustellen.
Bild von Enrique von Pixabay