CAT-Tools: Helfer für die Übersetzung

CAT-Tools: Helfer für die Übersetzung

Vor kurzem wurde ich von der KI von LinkedIn eingeladen, mich über technische Helfer zur Beschleunigung des Übersetzungsprozesses auszulassen – in Englisch und mit Zeichenlimit (den kollaborativen LI-Artikel zu CAT-Tools finden Sie hier). Hier gibt’s meine unlimitierten Überlegungen zu CAT-Tools wie Translation Memories (TM), Glossaren / Termbanken (TB), Automatisierungs-Tools, Kollaborations-Tools, Maschineller Übersetzung (MÜ, MT), etc. in Deutsch.

Weiterlesen: CAT-Tools: Helfer für die Übersetzung

Translation Memory

Die Basis aller modernen CAT-Tools sind seit Langem sogenannte Translation Memory-Systeme, zu Deutsch: Übersetzungsspeicher. Sie speichern beim Übersetzen paarweise Quell- und zielsprachliche “Segmente” (meist ganze Sätze, manchmal nur Teilsätze) und bieten einem all das, was man schon einmal so oder so ähnlich übersetzt hat, als Vorschlag für ein neues Segment an. Volle Übereinstimmungen nennt man im Jargon “Full Match”, Teilübereinstimmungen von (einstellbar) 80-99% “Partial Matches”. Aus meiner Erfahrung kosten Partial Matches unter 80% eher Zeit, als dass sie diese einsparen.

Meine drei Tipps in aller Kürze:

  1. Translation Memories nach Kunden oder nach Projekt trennen
  2. Translation Memories mindestens jährlich warten und pflegen
  3. Klären, wie vertrauenswürdig Translation Memories von Dritten sind

Teile und herrsche

Professionelle Übersetzer:innen achten in der Regel darauf, kundenspezifische Translation Memorys (TMs) oder sogar projektspezifische TMs zu führen, wobei auch mehrere TMs parallel verwendet werden können. Außerdem kann man ggf. einstellen, welche nur lesbar eingebunden sind und welche die neuen Übersetzungen aufnehmen sollen. Früher war es üblich, auch große branchenspezifische TMs zu sammeln oder aus einzelnen TMs zusammenzuführen. Allerdings kann dies zum einen den Schreibstil, den ein Übersetzer mit einem seiner Kunden vereinbart hat, „kontaminieren“ und die zugesicherte Vertraulichkeit gefährden. Zum anderen ist die heutige maschinelle Übersetzung (MT) oft besser darin, allgemeine, unspezifische Textvorschläge zu liefern – verdient dafür aber keinerlei Vertrauen, im Gegensatz zu den eigenen gespeicherten Übersetzungen.

Unkraut jäten

Der Schlüssel zur Wirksamkeit von TMs in CAT-Tools liegt in deren Wartung, die viel zu oft vernachlässigt wird. Mit der Zeit werden TMs durch schädliche Segmente verunreinigt:

  • Nicht erkannte Tippfehler oder Fehlübersetzungen
  • Veraltete Formulierungen
  • Doppelte Einträge, die den Übereinstimmungswert verringern

Wenn man mit einem solchen TM arbeitet, ohne dieses Unkraut auszurupfen, wird der Vorteil, den ein TM modernen Übersetzer:innen bieten soll, letztlich zunichtegemacht.

Ach, ist das so?

Die Quelle Ihres TMs ist der dritte Punkt, über den sich Übersetzer Gedanken machen sollten. Vor allem, wenn sie mit Agenturen zusammenarbeiten, stellen diese oft ihre eigenen TMs für ein Projekt zur Verfügung. Das hilft dabei, den Stil zu imitieren, den die Agentur und ihr Endkunde gewohnt sind.

Freiberufler:innen sollten jedoch – idealerweise schriftlich – klären, ob die darin enthaltenen Einträge „heilig“ sind und auf jeden Fall befolgt werden müssen, oder ob man freie Hand hat, Dinge anders zu formulieren oder Matches zu ignorieren oder zu korrigieren, die man für problematisch hält. Dass ein TM von der Agentur stammt, ist nun einmal keine Garantie dafür, dass sie sich um die Pflege des TMs bemüht hat (siehe Tipp 2).

Glossare und Terminologie-Datenbanken

Für Glossare oder Terminologiedatenbanken (TBs) gilt im Grunde das Gleiche wie für Translation Memories: Übersetzer können ein allgemeines Glossar führen, das ihre gesamte Arbeit umfasst, und zusätzlich kunden- oder projektspezifische Terminologiedatenbanken unterhalten. Oft möchte ein bestimmter Kunde eine andere Formulierung als ein anderer –das kann sogar unter zwei Produkten desselben Herstellers der Fall sein. Daher ist es durchaus sinnvoll, diese getrennt zu halten oder zumindest mit einem Hinweis zu annotieren.

Was man im Kopf behalten sollte, ist der Unterschied zwischen einem Glossar und einer TB: In einem Glossar werden ausgangssprachliche Wörter, Kollokationen oder sogar Sätze mit ihrer zielsprachlichen Entsprechung festgehalten. Eine TB basiert auf dem linguistischen Konzept eines „Terms“ und wird idealerweise von einer Reihe von Kontextinformationen begleitet:

  • Vertrauenswürdigkeitsbewertung,
  • Grammatik (Wortart, grammatisches Geschlecht, erforderliche Präposition, etc.),
  • Sprachvariante,
  • Informationen darüber, auf welchen Kunden oder welches Produkt der Term sich bezieht,
  • Kontextinformationen und Anwendungsbeispiele, einschließlich Bilder oder anderer Medien,
  • Anmerkungen des Übersetzers und des Kunden,
  • Quellenangaben
  • und nicht zuletzt: eine klare Definition.

Welches dieser möglichen TB-Felder jeweils sinnvoll ist, ist natürlich die Entscheidung der Übersetzerin oder des Übersetzers. Je nach Setup können auch weitere Felder sinnvoll sein.

Literaturtipp: Alles Wichtige zum Thema Terminologiearbeit findet sich im Arbeitsordner „Terminologiearbeit: Best Practices 2.0“ des Deutschen Terminologen-Tags.

Automatisierungssoftware

Das Stichwort „Automatisierungssoftware“ ist schwer zu greifen, weil sie alles und nichts sein kann. Einige Automatisierungen sind so alltäglich geworden, dass man sie gar nicht mehr wahrnimmt, z. B. Rechtschreibprüfungen. In vielen CAT-Tools umfasst diese auch Grammatik- und Stilprüfungen, oder es gibt Add-ons für Stilprüfer wie LanguageTool (ich empfehle „Pro“ für mehr Datenschutz und Leistung).

CAT-Tools überprüfen oft auch, ob Zahlen oder Tags in Quell- und Zielsegmenten gleich sind, oder warnen den Übersetzer, wenn er einen Begriff verwendet, der in der TB nicht vorkommt oder der dort als mit der Qualitätsstufe „Verboten“ oder „Veraltet“ eingestuft ist. Und das ist nur, was moderne CAT-Tools heute selbst bieten.

Viele weitere Software-Helfer haben ihren Weg in Übersetzungsbüros auf der ganzen Welt gefunden, für nahezu jeden Zweck, zum Beispiel AutoHotkey (AHK) oder TyperTask, mit dem man kleine Scripte schreiben kann, um z. B. wenige Buchstaben zu ganzen Standard-Textblöcken zu expandieren. übersetzungsspezifische Qualitätssicherungs-Tools sind z. B. Xbench, Linguistic Toolbox oder Verifika.

Kollaborationssoftware

Wenn es um Tools für die Zusammenarbeit geht, ist es natürlich am einfachsten, sich an die Big Player zu wenden und dort ein Konto für alle Kommunikations- oder Dateifreigabeanforderungen eines Übersetzers zu eröffnen. Es gibt jedoch gute Gründe für Übersetzer, sich eine Software anzusehen, die bei ihrem (vertraglich gebundenen) Website-Provider oder möglicherweise auf ihrem eigenen Büro-/Homeserver gehostet wird, wie z. B. Nextcloud, Dokumentenmanagement-Systeme (DMS), einen eigenen URL-Shortener wie YOURLS, usw. Die wichtigsten Gründe dafür sind natürlich Vertraulichkeit, Datensicherheit und Datenschutz.

Ein bekanntes Meme lautet: „Die Cloud ist nur der Computer eines anderen“, und auch wenn man den Spruch nicht ganz ernst nehmen sollte, stimmt er zumindest teilweise. Auch „kostenlose“ Cloud-Dienste werden irgendwie bezahlt, in vielen Fällen durch Werbung oder indem mit den gehosteten Daten Geld verdient wird. Das bedeutet, dass geschäftliche Nutzer (ja, auch Übersetzer:innen!) nach Möglichkeit die Finger davon lassen und etwas Geld oder Eigenleistung investieren sollten: Die Daten unserer Kunden und von uns selbst haben einen Wert und sollten daher entsprechend geschützt werden.

Maschinelle Übersetzung

Maschinelle Übersetzung (MT) gibt es schon lange: Die ersten funktionierenden statistischen MT-Systeme (SMT) wurden in den 1980er Jahren von IBM entwickelt, aber die Grundlagen reichen bis in die 50er Jahre zurück. Im letzten Jahrzehnt sind sie mit der neuronalen MÜ (NMÜ) gut genug geworden, um tatsächlich von Nutzen zu sein. Die großen CAT-Tool-Hersteller bieten eigene MT-Provider an, aber man kann auch Cloud-Anbieter wie Google Translate, Bing Translator und natürlich DeepL per Plugin einbinden. Die Königsklasse wäre natürlich, auf dem Heimserver oder in der Virtual Machine ein mit den eigenen Texten trainiertes KantanMT oder die Open Source-MT-Engines OpenNTM, LibreTranslate oder Apertium laufen zu lassen…

MT macht leider immer noch ganz typische MT-Fehler, die sich von denen unterscheiden, die menschliche Übersetzer:innen machen würden. Ein viel breiteres Publikum als früher macht diese Erfahrung nun mit großen Sprachmodellen (LLMs), bei denen das unheimliche „Wow, ist das gut!“ bald durch das Erkennen der (vielen) Unzulänglichkeiten dieser scheinbaren Wundertechnologie ersetzt wird. Die Ausgabe von LLMs kann aber oft ohne weiteres vom Benutzer verstanden und auf ihre Qualität hin eingeschätzt werden, während die Ausgabe von MT oft in Situationen verwendet wird, in denen Benutzer:innen die Ausgabe eben nicht verstehen.

In einem professionellen Umfeld kann MT immer noch nicht mehr sein als ein weiteres – hoffentlich bezahltes und mit einem Auftragsverarbeitungsvertrag (AVV) rechtlich abgesichertes – Werkzeug im Werkzeugkasten der menschlichen Profis. Aber es ist durchaus ein wertvolles Werkzeug, das Zeit sparen und einen auf neue Ideen bringen kann, wenn man sich nicht in die Irre führen lässt. Abgesehen davon ist PEMT (Post-Editing Machine Translation, das Nachbearbeiten von Maschinenübersetzungen) in vielerlei Hinsicht eine ganz andere Arbeit als die eines Übersetzers – bis hin zu unterschiedlichen Gehirnmustern, die sich auf Gehirnscans zeigen, wenn man entweder das eine oder das andere tut.

Lokalisierungssoftware als CAT-Tool Spezialfall

Lokalisierung (l10n) ist die Kehrseite der Internationalisierung (i18n). Letztere ist die Arbeit von Programmierern, die dafür sorgen, dass ihre Software, App, Website oder ihr anderes Produkt in der Lage ist, den Inhalt je nach dem Gebietsschema oder der gewählten Sprache des Benutzers zu ersetzen. Ersteres ist die Arbeit von Übersetzer:innen („Lokalisierer:in“ ist eher ungebräuchlich), die den Inhalt an eine neue Sprache und Kultur anpassen.

Dabei handelt es sich meist um Text, aber auch um Grafiken, Farbschemata, Sounds und andere Elemente, die für die Nutzbarkeit des Produkts in einer anderen Sprache und Kultur relevant sind. Lokalisierungssoftware ist folglich auf diese Aufgabe ausgerichtet und unterscheidet sich von CAT-Tools (Computer-Aided Translation).

In der Praxis ist mir übrigens noch nie angetragen worden, ein L10N-Tool statt ein CAT-Tool zu verwenden: Die meisten Übersetzungskunden im Bereich Industrielle IT schicken einem nach wie vor Excel-Tabellen oder PO- oder XML-Dateien mit Strings und machen die übrige Lokalisierungsarbeit In-House.

Abschließende Tipps zu (CAT-)Tools

Man sollte immer im Hinterkopf behalten, dass all diese elektronischen Tools und Werkzeuge genau das sind: Hilfsmittel. Es lohnt sich also, darauf zu achten, das richtige Werkzeug für die richtige Aufgabe zu verwenden. Wenn Sie feststellen, dass ein Tool Sie behindert, anstatt hilfreich zu sein, werden sie es los.

Testen Sie Demo-/Testversionen, bevor Sie teure Spezialsoftware wie Translation Environments kaufen, und vergessen Sie nicht den oben erwähnten Aspekt der Datensicherheit und Vertraulichkeit. Die meisten CAT-Tools neigen dazu, Benutzer stark an den jeweiligen Anbieter zu binden („vendor lock-in“), also entscheiden Sie bewusst, in welche Falle Sie tappen wollen.

Und nicht zuletzt: Wenn Sie sich mit Papier und Füller oder Bleistift bei der Arbeit am Text am wohlsten fühlen und darauf ein Geschäft aufbauen können, ist das genauso gut wie das modernste, hochwertigste Cloud-KI-Bling-Bling für Ihr Büro.

Fragen Sie sich selbst: Hilft mir das oder behindert es mich? Macht es mich produktiver oder bremst es mich aus und lenkt mich von der Übersetzungsarbeit ab? Hilft es mir, die Qualität meiner Arbeit zu erhöhen und Fehler zu vermeiden? Diese Fragen werden sich (wortwörtlich) direkt in Geld und dem Erfolg Ihres Unternehmens niederschlagen.

Haben Sie weitere Tipps zum Umgang mit Technik im Übersetzungsbüro? Ich bin gespannt, sie zu lesen!

Christopher Köbel (Portrait)
Christopher Köbel

Inhaber von DeFrEnT Christopher Köbel. Fachübersetzer für Deutsch, Französisch und Englisch für die Branchen IT, Web, Maschinen- und Anlagenbau, Kunststoffe, Industrie 4.0. Allgemein ermächtigter Übersetzer für Französisch und Englisch. Mitglied im Bundesverband der Dolmetscher und Übersetzer (BDÜ).

Schreibe einen Kommentar