25.01.2022

MTPE: Maßgeschneidert oder von der Stange? Wie Vorgaben sichern, dass maschinelle Übersetzung passt

Unsere Expertin für Übersetzungsmanagement, Nicole Sixdorf, hat sich kürzlich laut gefragt, was der entscheidende Faktor für die professionelle und unternehmenstaugliche Verwendung maschineller Übersetzung ist – und dazu einen Vortrag für die Fachanwender:innen des Branchenverbands tekom gehalten. Diese Erkenntnisse hat sie nun in einem aufschlussreichen Beitrag zusammengefasst. Darin erläutert sie, dass es die richtigen Vorgaben braucht, welche das sind – und was das mit dem Tragekomfort einer Winterjacke zu tun hat.

Hier weiterlesen

Unternehmen bringen maschinelle Übersetzung (Machine Translation, MT) zum Einsatz oder haben dies vor, damit Übersetzungen schneller und günstiger erledigt werden. Es sollen Kosten, Zeit oder am besten beides gespart werden. Eine zentrale Frage ist in diesem Kontext, ob die MT überhaupt in der Lage ist, unternehmensspezifische Vorgaben zu berücksichtigen: Kann eine Maschine spezifische Stilrichtlinien, Fachvokabular und Corporate Language so wiedergeben, wie Unternehmen sie konsistent in ihren Texten und eben auch in ihren Übersetzungen brauchen? Oder scheitert der Wunsch nach maschineller Übersetzung an unternehmensspezifischen Vorgaben? Bleibt also nur die Humanübersetzung? Und müssen Unternehmen an maschineller Übersetzung einfach nehmen, was die Maschine auswirft? Um es kurz zu machen: Nein. Einfach nehmen muss man nichts.

Es muss passen … wie eine Winterjacke

Eine Jacke? Genau, aber nicht irgendeine. Denn da gibt es einmal die Winterjacke, die einen schon seit Jahren treu begleitet. Bei der man weiß, woran man ist, die sitzt und warmhält – auch wenn es mal fünf Minuten dauert, bis der Reißverschluss greift. Diese Jacke ist unsere Humanübersetzung.
Und dann gibt es diese neue Jacke, die man sich zulegen will, damit der Reißverschluss gut zugeht und man auch bei minus 15 Grad vor die Tür kann. Von dieser Jacke gibt es auf dem Markt allerdings gefühlt hunderte Modelle, unter denen man sich erstmal für das richtige entscheiden muss. Das ist unsere maschinelle Übersetzung.

Die Jacken-Analogie verdeutlicht gut, worum es bei der Entscheidung geht. Denn die neue Jacke ergänzt die Auswahl. Die Entscheidung für sie bedeutet nicht, dass man seine alte nie mehr anziehen wird. Will man also maschinelle Übersetzung nutzen, heißt das nicht, dass man nicht auch Humanübersetzungen nutzen kann. Vielmehr nutzt man die eine oder die andere je nach Wetterlage bzw. je nach Bedarf und Vorgaben.

Das Für und Wider der Entscheidung betrifft dabei ausschließlich die Auswahl der neuen Jacke. Und dazu schaut man sich erstmal an, wie das Wetter wird. Im übertragenen Sinne: Vor der Entscheidung für oder gegen den Einsatz maschineller Übersetzung ist zu überlegen, wofür genau sie genutzt werden soll. Hier treten die Vorgaben auf den Plan.

Wenn man sich eine neue Jacke anschafft, überlegt man auch, welche Größe man braucht, wie teuer sie sein darf, wie viele Taschen und was sie sonst noch haben soll; eine Kapuze zum Beispiel. In puncto MT ist das nicht anders. Am Anfang steht dort ein Check der Vorgaben, der die Ausgangssituation und den Übersetzungsbedarf im Unternehmen ebenso aufzeigt wie den Ansatzpunkt für eine zeit- und kosteneffektive maschinelle Übersetzung.

Hilfreiche Fragen zur Klärung des Übersetzungsbedarfs:

Welche Texte sollen übersetzt werden? Texte aus einem bestimmten Gebiet, z. B. technische Texte?
Wie ist die Textqualität der Ausgangstexte? Stimmen Rechtschreibung, Grammatik etc.?
Handelt es sich um Fließtexte?
Sind die Texte gut formatiert?
Wie groß ist das Volumen?
Welche Sprachkombinationen werden benötigt?
Gibt es Budgetvorgaben? Sollen bspw. nur Kosten für eine bestimmte Textart eingespart werden, weil diese das größte Volumen ausmachen?
Gibt es zeitliche Budgets, weil ich oft knappe Anschlusstermine habe?
Wie sollen die maschinell übersetzten Texte verwendet werden? Extern? Oder nur intern?
Welche Vorgaben habe ich hinsichtlich des Datenschutzes und der Datensicherheit?
Ist ein bestimmtes Risikolevel zu beachten? Bspw. Risiken für Imageschäden, Personenschäden, Sachschäden?
Gibt es eine Terminologie?
Gibt es Stilrichtlinien? Oder Formatierungsrichtlinien?

Diese Kriterien bestimmen maßgeblich die Machbarkeit von maschineller Übersetzung. Sie bestimmen die Auswahl des MT-Systems und sind die Richtlinien für die Posteditieren genannte Nachbearbeitung maschineller Übersetzungen. Doch, der Reihe nach.

Wissen, wovon man spricht: die Terminologie

Eine weitere zentrale Frage, die in diesem Kontext gestellt wird: Ist es bei maschineller Übersetzung relevant, dass Unternehmen einen Terminologiebestand haben? Um es erneut kurz zu machen: Ja.

Wenn man eine eigene Maschine für die Übersetzung trainieren will, ist eine sauber gepflegte Terminologie essenziell für die spätere Output-Qualität. Bei maschineller Übersetzung von der Stange spielt die Terminologie ebenfalls eine wichtige Rolle für die Konsistenz in der Nachbearbeitung. Sieht man sich in der Vorüberlegung bereits einem „riesigen Terminologiebestand“ gegenüber, ist es ratsam, sich diesen zunächst genauer anzusehen, statt den Gedanken an die MT zu verwerfen. Denn veraltete Termini, Dubletten, überflüssig festgelegte oder uneinheitliche Termini beeinflussen nicht nur die Qualität, sondern auch die Einsparpotenziale – übrigens auch für die Humanübersetzung.

In der Jacken-Analogie sind wir nun auf die Anschaffung vorbereitet und können gezielt an die Frage herangehen, ob man mit einer Jacke von der Stange glücklich wird oder ob eine maßschneidern lässt.

Wissen, was geht: das Training

Die Analogie „maßgeschneidert oder von der Stange“ bezieht sich auf die grobe Unterscheidung von generischen „untrainierten“ Maschinen und kundenspezifisch „trainierten“ Maschinen. Um zu verstehen, was sich dahinter verbirgt, schauen wir mal auf die Feinheiten.

Als „untrainiert“ werden hier jene Maschinen bezeichnet, die mit Daten für bestimmte Sprachkombinationen trainiert wurden, aber eben mit wenig spezialisierten Textkorpora. Bekannte Anbieter sind DeepL oder Google Translate. Eine zweite Form dieser generischen Maschinen sind domänenspezifische Engines, die auch für bestimmte Sprachkombinationen trainiert wurden, dabei jedoch in ihren Trainingsdaten selektiver sind und sich auf Sachgebiete wie etwa Maschinenbau, Software oder Recht spezialisieren.

Unter „trainierten“ Maschinen versteht man unternehmensspezifische oder auch customized Engines. Diese werden direkt mit zweisprachigen Daten aus dem Unternehmen trainiert. Hier tragen Vorgaben wesentlich zum Gelingen des Projekts bei.

Ein Vorteil von trainierten Maschinen ist, dass Unternehmensvorgaben eingehalten werden. Sind also etwa ein bestimmter Stil oder Spezifikationen vorhanden, wie Texte übersetzt werden sollen, setzt die Maschine dies auch so um, da sie mit Texten trainiert wird, die bisher in gleicher Form für das Unternehmen übersetzt wurden. Wie gut die Maschine das umsetzt, hängt vom Trainingsmaterial bzw. davon ab, ob die Vorgaben auch in den bisherigen Übersetzungen eingehalten wurden.

Wichtigster Faktor ist dabei die Terminologie. Denn der Fachwortschatz und das unternehmensspezifische Vokabular können nur von trainierten Maschinen korrekt eingebunden werden. Nur beim Training kann gewährleistet werden, dass es von der Maschine richtig erkannt und entsprechend richtig und konsistent übertragen wird.

Der Stil entspricht bei einer trainierten Maschine dem Stil der Trainingsmaterialien bzw. den bisherigen Übersetzungen.

Weitere Informationen zum Training finden Sie in unserem Blogartikel „MT-Training: Macht Übung noch den Meister?“

Je nach Wetter und Anlass: der Kontext

Ob von der Stange oder maßgeschneidert, haben beide Ansätze eines gemeinsam: Kein MT-System schafft es bisher, Fachtexte komplett fehlerfrei und konsistent zu übersetzen. Jede Maschine ist nur so gut wie ihr Trainingsmaterial. Auch ein trainiertes System ist daher kein Garant für eine kontinuierlich hohe Qualität des Outputs. An Grenzen stoßen sie bspw., wenn man fachfremde Texte übersetzen lassen will.

Da der Einstieg in die maschinelle Übersetzung für viele Unternehmen zumeist jedoch mit generischen Systemen beginnt, schauen wir einmal ganz konkret, weshalb auch hier klar dokumentierte Vorgaben wie Styleguides und Terminologie erfolgsentscheidend sind.

DeepL bietet mittlerweile eine Glossarfunktion, über die man festlegen kann, wie bestimmte Wörter übersetzt werden sollen. Diese funktioniert auch recht gut, da die Maschine die Begriffe auch direkt sprachlich anpasst und bspw. Plural und Singular richtig wiedergeben kann. Anders sieht es allerdings beim Kontext aus. Im folgenden Beispiel (Screenshot) einmal am Begriff „Mutter“ verdeutlicht, bei dem sich die Glossarfunktion eher als Nachteil erweist, da eben der Kontext ignoriert wird.

Eine weitere wichtige Vorgabe ist auch die Ausgangsqualität von Text, der der Maschine vorgegeben wird – und zwar mit Punkt und Strich. Wie entscheidend diese Details sein können, zeigt exemplarisch das französische Wort „Arrêté“, das eine Verordnung oder einen Beschluss bezeichnet. Fehlt im Ausgangstext jedoch der Akzent auf dem letzten e, wird daraus das Wort „Arrête“, das z. B. „Anhalten“ meint. Im Ergebnis (Screenshot) versteht die Maschine auf einmal keinen Spaß mehr, weil sie den entscheidenden Bezug zum restlichen Text nicht korrekt herstellen kann.

Die klassischen Maschinenfehler in der Übersicht:

Inhaltliche Fehler, Fehlinterpretationen
Kontextfehler ☝?
Auslassung von vorhandenem Text
Ergänzungen bzw. zusätzlicher Text, der Ausgangstext nicht enthalten ist
Terminologiefehler, z. B. Eigennamen, die nicht erkannt werden, oder die inkonsistente Verwendung von Termini
Fehlerhafte Bezüge zwischen Satzteilen oder aufeinanderfolgenden Sätzen*
Tag-Fehler, z. B. Fehler bei der Formatierung wie Fettdruck
Schwächen in der Zeichensetzung

*Kurz ausgeführt: Die Maschine schaut sich den Kontext immer nur bis zum Satzpunkt an. Ihr ist es, mit Verlaub, Jacke wie Hose, was im Satz davor oder danach stand.

Die Übersetzung kommt also niemals perfekt und fehlerfrei aus der Maschine heraus. Die nächste zentrale Frage ist deshalb: Wie kann man sich die Kosten- und Zeitvorteile sichern und trotzdem eine der Humanübersetzung qualitativ gleichwertige maschinelle Übersetzung erhalten, die eben die eigenen Spezifikationen und Vorgaben erfüllt?

Hier kommt nun der wesentliche Faktor für die unternehmenstaugliche, professionelle maschinelle Übersetzung hinzu – und aus MT wird MTPE: Machine Translation + Post-Editing. Das zuvor genannte Posteditieren, also die Nachbearbeitung der maschinellen (Vor-)Übersetzung durch qualifizierte Posteditor:innen.

In unserer Winterjacken-Analogie wäre das der Punkt, an dem die Jacke zum:zur Schneider:in gebracht wird. Doch Sie wissen ja noch gar nicht, ob sie Ihnen passt.

Anprobieren, ob es passt: die Machbarkeitsanalyse

Nicht jedes Dokument, jede Sprachkombination oder jeder Inhalt ist für die maschinelle Vorübersetzung geeignet. Je spezieller und individueller die Vorgaben an die Übersetzung sind, desto kritischer muss betrachtet werden, ob durch MTPE überhaupt noch ein Kosten- und Zeitvorteil erzielt werden kann.

Die Maschine nimmt natürlich jeden Text an, gibt ihn in der Übersetzung jedoch nur so aus, wie sie ihn „interpretieren“ kann. Das Ergebnis kann fast hundertprozentig stimmen oder auch komplett falsch sein – wie die typischen Maschinenfehler zeigen. In solchen Fällen kann es schneller und günstiger sein, Texte direkt humanübersetzen zu lassen.

Entscheidend ist immer und für jedes Projekt die Machbarkeit, also die individuelle Analyse aller Aspekte, die Einfluss auf die Eignung für MTPE haben: Von den Sprachen, Sachgebieten und Recherche-Intensität bis zu den Inhalten und Satzstrukturen. Es gilt, in Kontext (!) und Detail zu entscheiden, welche Texte sich eignen und an welchen Stellschrauben gedreht werden kann, um den Prozess zu optimieren. Letzteres können z. B. gut gepflegte Terminologiedatenbanken oder auch hybride Lösungen sein – also etwa die gemeinsame Nutzung von maschineller Übersetzung und Translation Memory, um bereits übersetzte Texte nicht erneut von der Maschine übersetzen lassen und anpassen zu müssen.

Dann geht es zum Schneider: das Posteditieren

Wir bleiben bei der Jacken-Analogie, denn das Bild der Schneider:innen passt: Unsere Posteditor:innen gehen nach Bedarf zu Werke und maßschneidern entweder die maschinelle Übersetzung von der Stange oder bringen den individuellen Zuschnitt der unternehmenseigenen Maschine in Form. Die ausgebildeten Übersetzer:innen und Linguist:innen haben dafür sowohl großes Verständnis für die Funktionsweisen und Zielsetzungen der maschinellen Übersetzung als auch umfassende Sprach- und Fachkompetenz. Zudem kennen sie die individuellen Vorgaben und Fachterminologien. Und sie haben immer auch die Wirtschaftlichkeit des Projekts im Auge, da – wie beim Auftrag an Schneider:innen – die Devise gilt: Geringstmögliche Änderungen mit größtmöglichem Effekt!

Fazit: Wenn es passt und stimmt, ist es richtig

Wie bei der Wahl der neuen Winterjacke, gilt auch bei der Entscheidung für die maschinelle Übersetzung, die eigenen Qualitätsansprüche zu kennen und in Form entsprechender Vorgaben für sich festzuhalten. Diese Vorgaben bestimmen sowohl die Wahl des MT-Systems als auch die generelle Mach- bzw. Durchführbarkeit von MTPE-Projekten. Und sie sind wichtige Richtlinien in der Nachbereitung maschineller Texte. Denn man muss eben nie einfach nehmen, was die Maschine einem auswirft.

Vorgaben sind dabei nicht nur rein sprachlich und fachlich zu fassen, sondern auch auf assoziierte Bereiche wie Datenschutz und -sicherheit auszuweiten. Denn nicht immer ist die günstigste bzw. die kostenlose Lösung auch die sinnvollste. Gerade wenn Texte z. B. sensible Daten enthalten oder weniger geeignete Texte maschinell übersetzt werden sollen und es zu einer hohen Änderungsquote im Posteditieren kommen würde. Ob für das in Qualität, Zeit- und Kostenaufwand bestmögliche Übersetzungsergebnis MTPE oder Humanübersetzung zum Einsatz kommen, ist letztlich eine Einzelfallentscheidung.

Um machbare Übersetzungsergebnisse zu erzielen, die „wie angegossen“ passen, sollte eine mögliche Zusammenarbeit immer mit einer Beratung durch Fachexpert:innen beginnen. Diese umfasst eine Erstanalyse und Bestandsaufnahme, vor allem aber fokussiert sie auf die konkreten Vorstellungen und individuellen Ziele – die Vorgaben. Wir stehen dafür in jeder Saison zur Verfügung.