26.05.2021

Viele Wege führen zur Terminologie: Eine konsistente Unternehmenssprache von Anfang an

Terminologieerstellung oder -extraktion wird auch als Term Mining bezeichnet, was passende Parallelen aufzeigt: Genau wie Gestein oder Mineralien sind auch die Termini bereits vorhanden, eventuell tief in den Dokumenten eines Unternehmens verborgen, aber auf jeden Fall wertvoll für die Corporate Language. Alles, was getan werden muss, ist also, diesen Wortbestand freizulegen und ans Licht zu befördern.

Unabhängig, ob es um den ersten Aufbau eines Terminologiebestands geht, um die zweisprachige Erfassung von Termini aus einem Übersetzungsprojekt oder um das Zusammentragen projektbezogener Termini zu einem bestimmten Produkt.

Grundsätzlich gibt es fünf Quellen, um an Terminologie zu gelangen:

1. Terminologie in Reinform, wie sie in Katalogen, Produktlisten und Glossaren vorkommt. Hieraus können die Termini einfach entnommen und als Datenbestand aufbereitet werden.

2. Listen und vorhandene Bestände, die im Rahmen von Projekten oder Abteilungen bereits zusammengetragen wurden. Häufig kursieren in Unternehmen mehrere solcher Listen, von denen andere Abteilungen eventuell gar nichts wissen.

3. Implizites Terminologiewissen der Belegschaft. Jede:r im Unternehmen kommuniziert über Produkte und Leistungen und benennt diese entsprechend.

4. Terminologieverwendung bei der Texterstellung. Sowohl bei der ausgangssprachlichen Erstellung als auch bei Übersetzungen wird Terminologie recherchiert und verwendet. Diese nochmals separat zu erfassen, kann also als manuelle Extraktion aus Texten bezeichnet werden.

5. Teilautomatisierte Extraktion aus vorhandenen Dokumenten und Datenbeständen. Hierbei wird ein Textkorpus auf die darin verwendeten Termini geprüft und diese in Listenform extrahiert.

Linguistische und statistische Extraktion

Um relativ schnell und umfassend an bisher im Unternehmen verwendete Terminologie zu gelangen, bietet sich die letztgenannte Quelle, die teilautomatisierte Extraktion an. Für die softwaregestützte Terminologieextraktion stehen zwei Methoden zur Verfügung: linguistische und statistische.

Linguistische Systeme sind sprachabhängig, da ihnen Wortbildungsregeln und syntaktische Algorithmen einer bestimmten Sprache zugrunde liegen. Eine linguistische Extraktionssoftware deckt also immer nur eine gewisse Anzahl an Sprachen ab. Sie wird meist zur einsprachigen Extraktion verwendet, aber auch mehrsprachige Extraktionen sind als Hybridform (linguistisch/statistisch) möglich. Das Ergebnis linguistischer Verfahren ist eine Liste sprachlich korrekter Wörter, die aber nicht zwingend terminologische Relevanz haben.

Statistische Verfahren sind hingegen sprachunabhängig. Sie ermitteln eine Wortfrequenz, also die Vorkommenshäufigkeit eines Wortes im Textkorpus, wodurch die betrachtete Sprache keine Rolle spielt. Die Extraktion erfolgt einsprachig aus einem Textbestand oder zweisprachig aus bisherigen Übersetzungen, zum Beispiel aus einem Translation-Memory-System. Dabei gilt: Je größer die Textgrundlage, desto höher ist die Vorkommenshäufigkeit einzelner Wörter und desto besser ist das Ergebnis. In der ausgegebenen Trefferliste kommen die Wörter allerdings nicht nur in Reinform, sondern durchaus auch in Plural- und Flexionsformen oder als Wortteile vor. Das Ergebnis muss also sowohl sprachlich als auch terminologisch bereinigt werden.

Terminologische Relevanz

Beide genannten Verfahren erkennen keine terminologische Relevanz der extrahierten Wörter. Vieles von dem, was extrahiert wird, sind also unter Umständen gar keine Fachtermini, sondern allgemeine Wörter. Über die Relevanz einzelner Termkandidaten können immer nur die Projektverantwortlichen entscheiden, da Terminologie sehr subjektiv ist: was für ein Unternehmen wichtige Fachterminologie ist, ist für das nächste Unternehmen irrelevant. Es erfordert also immer manuelle Nacharbeit und eine menschliche Entscheidung, um Termkandidaten zu evaluieren und zu validieren.

Ergebnisse mit Mehrwert

Zusätzlich zu einer Liste mit relevanten Termini liefert eine teilautomatisierte Extraktion weitere Daten, die für die Terminologiearbeit eines Unternehmens einen Mehrwert darstellen können: Die Vorkommenshäufigkeit eines Terminus, die Dateinamen, in denen er vorkommt, und ein passender Kontextsatz aus dem Textkorpus können in den meisten Tools direkt mitgeliefert werden.

Je nach Software werden außerdem verschiedene Schreibweisen direkt erkannt und zusammengefasst (beispielsweise Ink-Jet-Drucker und Inkjet-Drucker) oder lassen sich durch eine alphabetische Sortierung schnell erkennen. Eine zweisprachige Extraktion liefert durch die fremdsprachlichen Äquivalente darüber hinaus sogar das Potenzial, Synonyme in der Ausgangssprache zu erkennen. Wenn beispielsweise „tie“ im Englischen sowohl für „Krawatte“ als auch für „Schlips“ verwendet wird, kann darüber ein deutsches Synonym gefunden werden.

Zwar ist die Terminologiearbeit mit der Erstellung einer Liste relevanter Termini längst nicht abgeschlossen, aber ein erster, wichtiger Meilenstein lässt sich durch eine Extraktion erreichen. Sowohl bei der Extraktion selbst als auch bei der sprachlichen und terminologischen Bereinigung und dem Anreichern mit Zusatzinformation sollten sich Unternehmen von einem Sprachdienstleister mit Terminologie-Expertise unterstützen lassen. Wie das effektiv funktioniert, erläutern wir Ihnen anhand unserer Services oder gern in einer persönlichen Terminologieberatung.

8 gute Gründe für oneword.

Erfahren Sie mehr über unsere Kompetenzen und was uns von klassischen Übersetzungsagenturen unterscheidet.

Wir liefern Ihnen 8 gute Gründe und noch viele weitere Argumente, warum eine Zusammenarbeit mit uns erfolgreich ist.

Angebot anfordern

    Ich bin damit einverstanden, dass mich die oneword GmbH kontaktiert und meine angegebenen Daten speichert.