27.01.2025

Übersetzungskosten sparen mit Translation Memorys

Fast unabhängig von der wirtschaftlichen Lage sind Einsparungen bei Übersetzungen ein Dauerthema. Auf der Übersetzungsbranche lastet ein Kostendruck, denn Unternehmen möchten die Ausgaben für Mehrsprachigkeit gerne so gering wie möglich halten. Viele behelfen sich mit maschineller Übersetzung oder betreten mit dem Einsatz von Large Language Models neues Terrain und lassen dabei die Qualität außer Acht. Dabei müssen es nicht immer neue Technologien sein, um bares Geld zu sparen. Wir zeigen, welches Einsparpotenzial in Translation Memorys, einem Klassiker der Übersetzungstools steckt, wie der Einsatz sinnvoll unterstützt werden kann und warum den dort entstehenden Sprachdaten ein hoher Stellenwert beigemessen werden sollte.

Auch wenn Translation Memorys (TM) zur Standardsoftware in der Übersetzungsbranche gehören, haben viele Unternehmen damit wenig Berührungspunkte. TMs sind eine Komponente von CAT-Tools (Computer-assisted Translation). Sofern Unternehmen nicht selbst über ein solches Tool verfügen, findet der Einsatz im Hintergrund beim Übersetzungsdienstleister oder den freiberuflichen Übersetzer:innen statt. Translation Memorys sind Speicher, in die übersetzte Texte pro Sprachpaar und aufgeteilt in Segmente gespeichert werden. Ein Segment umfasst dabei meist einen kompletten Satz, kann aber auch nur ein Einzelwort sein, wenn dieses zum Beispiel innerhalb einer Auflistung alleinstehend vorkam. Jedes im TM gespeicherte Segment ist zusätzlich mit Metadaten – wie dem Erstellungsdatum – angereichert und steht bei zukünftigen Projekten zur Verfügung.

Einsatz von Translation Memorys

Jeder neu zu übersetzende Text wird automatisiert mit dem Translation Memory für die jeweilige Sprachrichtung abgeglichen. Dabei werden sowohl identische – also bereits übersetzte – als auch zu vorhandenen Übersetzungen ähnliche Segmente erkannt. Ein bereits übersetztes Segment wird als 100 %-Match bezeichnet, kann im neuen Text vorbefüllt werden und wird dann im Projekt nur noch überprüft und deshalb rabattiert berechnet. Ähnliche Segmente weichen zwischen 1 % und 15 % von einem bereits übersetzten Segment ab und werden als Fuzzy Match bezeichnet. Die ursprüngliche Übersetzung kann dann als Grundlage verwendet und der abweichende Teil angepasst werden. Auch für Fuzzy Matches ergeben sich daher reduzierte Kosten, da keine komplette Neuübersetzung nötig ist.

Der Einsatz eines Translation Memorys spart einerseits Geld und Zeit, da bereits übersetzte Texte nicht nochmals übersetzt und berechnet werden. Durch diese Wiederverwendung wird außerdem Konsistenz zu Vorgängertexten hergestellt, was deutlich auf die Qualität der Übersetzungen einzahlen kann. Auch wenn Unternehmen selbst kein TM besitzen, sollten ihnen die für sie gespeicherten Daten mittels Exports jederzeit zur Verfügung gestellt werden können. Die Frage nach den Eigentumsrechten von Translation Memorys haben wir bereits in einem Blog erläutert.

Nutzung vorhandener Übersetzungen

Mithilfe von Translation Memorys werden bereits übersetzte Inhalte also genutzt, aber im Normalfall auch jedes Mal überprüft und damit – wenn auch rabattiert – berechnet. Wenn die TM-Inhalte schon älter sind, Terminologievorgaben geändert wurden oder die Qualität der TM-Daten zum Beispiel aufgrund eines Dienstleisterwechsels nicht gesichert ist, macht eine Überprüfung der 100 %-Matches definitiv Sinn. In anderen Fällen ist eine erneute Überprüfung aber nicht notwendig, beispielsweise weil das ursprüngliche Dokument erst vor wenigen Wochen übersetzt wurde. Sollen bereits übersetzte Segmente nicht nochmals geprüft und bezahlt werden, gibt es zwei Optionen: Entweder werden nur die neuen Textteile zur Übersetzung ausgelöst oder die Vorübersetzungen aus dem TM werden gesperrt. Jede Option hat dabei eigene Vor- und Nachteile, die im Vorfeld gemeinsam mit dem Dienstleister abgewogen werden sollten.

Fokus auf neue Inhalte

Beim gezielten Übersetzen nur neuer Textteile, beispielsweise eines zusätzlichen Abschnitts einer umfangreichen Anleitung, entfallen die Kosten für die Überprüfung bestehender Inhalte. In Redaktions- und PIM-Systemen ist durch die modulare Textspeicherung das Herausfiltern neuer Texte meist auf Knopfdruck möglich. Diese können dann als Datei exportiert und nach der Übersetzung in das bestehende Dokument übernommen werden. Für Word- oder InDesign-Dateien kann ein Versionsvergleich erfolgen, um Änderungen oder Ergänzungen sichtbar zu machen. Wenn die zu übersetzenden Textteile dann allerdings manuell zusammengestellt werden, steigt zusätzlich zum Bearbeitungsaufwand auch das Fehlerpotenzial. Denn bei der Zusammenstellung können Texte oder Änderungen übersehen werden oder beim Einfügen am falschen Platz landen. Vor allem in Sprachen oder Schriftsystemen, die selbst nicht beherrscht werden, besteht hier ein deutliches Risiko.

Für den Übersetzungsprozess bedeutet die Option der Zusammenstellung nur neuer Textteile, dass weniger Kontext vorhanden ist und die zu übersetzenden Segmente eventuell schwerer einzuordnen sind. Außerdem ist es nicht möglich, den Stil oder die Wortwahl des restlichen Dokuments zu kennen und zu treffen, wodurch es zu Stilbrüchen und Inkonsistenzen kommen kann. Dies kann umgangen werden, wenn das gesamte Dokument als Referenz mitgeliefert wird, in der die zu übersetzenden Passagen dann gesucht werden können. Aus einigen Redaktionssystemen kann dies automatisiert erfolgen. Mit Blick auf Kontext und Konsistenz ist es auf jeden Fall sinnvoll, immer das gesamte Dokument für die Übersetzung mitzugeben.

100 %-Matches für die Bearbeitung sperren

Darauf zielt auch die zweite Option ab, bei der die bestehenden 100 %-Matches aus dem Translation Memory verwendet werden, aber im CAT-Tool für die Bearbeitung gesperrt sind. Der Ausgangstext und die vorhandene Übersetzung werden dann zwar angezeigt, sind jedoch für die Übersetzer:innen nicht bearbeitbar. Der Text erscheint damit im Gesamtzusammenhang und die neu zu übersetzenden Texte können korrekt eingeordnet werden. Durch das Sperren der Segmente erfolgt allerdings auch keine Überprüfung, wodurch Fehler oder veraltete Terminologie in TM-Matches nicht auffallen. Gerade hinsichtlich der Terminologie kann es dadurch zu Inkonsistenzen kommen, beispielsweise wenn sich seit der Speicherung Vorgaben geändert haben, die dann nur in den neuen Segmenten umgesetzt werden.

Fallen in vorhandenen Segmenten, die nur zur Einordnung überflogen wurden, doch Fehler auf, besteht für Übersetzer:innen keine direkte Korrekturmöglichkeit. Nötige Änderungen können nur über Kommentare oder Hinweise bei der Lieferung angemerkt werden. Einen zusätzlichen Nachteil der Sperr-Option kann das Datenhandling darstellen. Denn wenn immer das gesamte Dokument übermittelt wird, führt dies vor allem bei Dateien aus Layout-Programmen schnell zu umfangreichen Dateipaketen, die gepackt und eventuell über ein Austauschprogramm bereitgestellt werden müssen.

Saubere Segmentierung

Translation Memorys leben von sauberen Daten. Für die Wiederverwendbarkeit der Segmente sind eine saubere Segmentierung und eine korrekte Übersetzung unerlässlich. Denn nur vollständige Segmente, deren Übersetzung korrekt ist und 1:1 dem Inhalt der Ausgangssprache entspricht, können bei zukünftigen Übersetzungsprojekten bedenkenlos verwendet werden. Welche Eingriffe und Aspekte einer sinnvollen Segmentierung im Weg stehen, zeigt unser Beitrag zum übersetzungsgerechten Schreiben zeigt. Ein Beispiel: Änderungen am Layout, beispielsweise ein manueller Zeilenumbruch, fragmentieren einen Satz und führen zu dessen Aufteilung in zwei Segmente. Aufgrund unterschiedlicher Wortreihenfolgen kann diese Fragmentierung zu unterschiedlichen Inhalten pro Segment führen, sodass sich Ausgangs- und Zielsegment nicht entsprechen:

Übersetzungskosten sparen mit Translation Memorys; Beispiel für schlechte Segmentierung

Die Wiederverwendbarkeit solcher Segmente ist außerdem gering, da in einem Folgeprojekt der gleiche Satz eventuell nicht umgebrochen wäre. Es würde dann 100 %-Match vorliegt, obwohl der Satz bereits übersetzt wurde.

Für eine optimale Nutzung der TM-Inhalte und des damit verbundenen Einsparpotenzials ist es daher sinnvoll, Texterstellungsprozesse hinsichtlich übersetzungsgerechtem Schreiben zu prüfen. Korrekt segmentierte Texte minimieren außerdem Rückfragen und sparen damit auch in diesem Prozessschritt Zeit und Geld, da vollständige Sätze besser verstanden werden und Inhalte einander klar zuordnet werden können.

Translation Memorys bereinigen

Wie bei allen Prozessen, in denen Daten entstehen und gespeichert werden, wachsen auch Translation Memorys schnell an. Mit jedem neuen Übersetzungsprojekt kommen Segmente hinzu, was bei umfangreichen Dokumenten schnell mehrere Tausend auf einen Schlag sein können. Allein dieses Wachstum macht schon eine regelmäßige Überprüfung sinnvoll. Wenn unsaubere Segmente – zum Beispiel aus den oben genannten Gründen – hinzukommen, ist eine Bereinigung unerlässlich. Denn bruchstückhafte Segmente und fehlende Entsprechungen zwischen Ausgangs- und Zielsprache machen die gespeicherten Segmente wertlos und können im schlimmsten Fall zu Fehlern bei Folgeübersetzungen führen.

Hinzu kommt, dass je nach Einstellung bei der Speicherung von Übersetzungen Dubletten entstehen können, also zwei oder sogar mehr Vorkommnisse des gleichen Inhalts. Diese werden in Folgeprojekten nicht als 100 %-Match erkannt, weil dem Ausgangstext keine eindeutige Entsprechung zugeordnet werden kann. Dubletten führen daher zu höheren Übersetzungskosten, da sie als Fuzzy Matches kategorisiert und berechnet werden. Auch die Änderungen von Terminologievorgaben können eine Bereinigung der TM-Inhalte erfordern. Dabei werden alle zu ändernden Termini gesucht und in den TM-Daten korrigiert, damit diese in der Folge wieder als korrekte Treffer genutzt werden können.

Egal ob reine Datenmenge, unsaubere oder mehrfach vorhandene Daten: Beim Einsatz von TMs ist es sinnvoll, eine Bereinigungsroutine zu entwickeln oder das Potenzial im Rahmen einer Analyse prüfen zu lassen. Damit können gezielte Schritte zur Bereinigung des Translation Memorys unternommen und das TM damit up-to-date gehalten werden. Unser Service oneCleanup setzt beispielsweise genau hier an, analysiert das Bereinigungspotenzial von TM-Daten und ermöglicht anschließend eine teilautomatisierte Bereinigung. Denn wie dargestellt handelt es sich bei TMs um wertvolle Sprachdaten, die Konsistenz gewährleisten, Prozesse beschleunigen und Kosten einsparen können. Dieses Asset sollte in Unternehmen keinesfalls ungeachtet bleiben.

Möchten Sie mehr über den Einsatz von Translation Memorys und die Sprachdatenbereinigung oneCleanup erfahren? Dann nehmen Sie noch heute Kontakt mit uns auf.

8 gute Gründe für oneword.

Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.

Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.

Angebot anfordern

    Ich bin damit einverstanden, dass mich die oneword GmbH kontaktiert und meine angegebenen Daten speichert.