Fuzzy Matches: Die Achillesferse von Translation-Memory-Systemen

Beitrag von François Massion  | Veröffentlicht am 9. April 2024  

Fuzzy Matches - Die unterschätzte Herausforderung. Was haben Fuzzy-Matches und diese kleine Geschichte gemeinsam? Vor mehr als einem Jahrhundert in Amerika unterlief einer Sekretärin ein folgenreicher Kommafehler bei der Übertragung der Eisenwerte von Spinat. Ein versehentlich verschobenes Komma führte dazu, dass Generationen von Kindern regelmäßig Spinat essen mussten, weil er angeblich eisenreich sei. Ein kleines Zeichen wie ein Komma, das weniger als 1 % des Satzumfangs ausmacht, kann somit weitreichende Folgen haben. Diese Erkenntnis ist besonders im Übersetzungsgewerbe von Bedeutung, wo solche „Winzlinge“ große Gefahren bergen.

Bild: Frank Petzold

Was ist ein Fuzzy-Match?

Im Bereich der Übersetzung und technischen Dokumentation ist Genauigkeit unerlässlich. Kleinste Fehler können in kritischen Bereichen wie Medizin, Technik oder Recht erhebliche Auswirkungen haben. Eine scheinbar kleine Unachtsamkeit kann zu Missverständnissen führen, die schwerwiegende Konsequenzen nach sich ziehen können. Diese Gefahr wird besonders deutlich, wenn wir über die Verwendung von Translation-Memory-Systemen (TM-Systemen) sprechen.

Die Einführung von TM-Systemen hat zweifellos die Arbeitsweise von Übersetzern und technischen Redakteuren grundlegend verändert. Früher musste jeder Satz neu übersetzt werden, was viel Zeit und Ressourcen in Anspruch nahm. Mit TM-Systemen können Übersetzer auf bereits existierende Übersetzungen zurückgreifen, was nicht nur Zeit spart, sondern auch die Konsistenz und Qualität der Übersetzungen verbessert.

Jedoch birgt diese Technologie auch ihre eigenen Herausforderungen. Insbesondere die sogenannten „Fuzzy Matches“ können zu einem zweischneidigen Schwert werden: Einerseits bieten sie Effizienz und Konsistenz, andererseits bergen sie das Risiko von Fehlinterpretationen, wenn Unterschiede übersehen werden. Fuzzy Matches sind Übersetzungen, die in der Datenbank vorhanden sind, aber nicht genau dem Ausgangstext entsprechen. Die Ähnlichkeit zwischen einem Text aus der Datenbank und einem zu übersetzenden Text wird oft in Prozenten angegeben. So könnte beispielsweise die Ähnlichkeit zwischen den Sätzen „Das Auto ist grün.“ und „Das Auto ist rot.“ bei 80 % liegen.

Welche Risiken bergen hohe Fuzzy-Match-Werte?

Der Teufel steckt oft im Detail, und genau hier liegt die Gefahr von Fuzzy-Matches. Besonders problematisch wird es, wenn der Ähnlichkeitsgrad relativ hoch ist, wie es bei den letzten 5 % der Fall ist. In diesem Bereich können geringfügige, aber äußerst wichtige Änderungen vom Übersetzer, der unter Zeitdruck arbeitet, übersehen werden. In der Praxis sind wir solchen Flüchtigkeitsfehlern regelmäßig begegnet. Das sind die kleinen Unterschiede mit großer Wirkung:

(1) Morpheme

Die Unterscheidung zwischen Wortstämmen und ihren Präfixen oder Suffixen kann in Übersetzungen entscheidend sein, besonders in sprachlichen Kontexten, in denen die Verneinung oder eine Zustandsänderung durch ein Präfix oder Suffix ausgedrückt wird. Beispielsweise:

Der Unterschied zwischen „dicht“ und „undicht“ kann in technischen Handbüchern oder wissenschaftlichen Texten fundamental sein, wo er die Machbarkeit oder die Lösung eines Problems betrifft.

Ähnlich kann der Unterschied zwischen „bezahlt“ und „unbezahlt“ (z. B. in Rechnungen oder juristischen Dokumenten) erhebliche finanzielle oder rechtliche Konsequenzen haben.

Diese Art von Fehlern kann besonders in Systemen mit hohen Fuzzy-Match-Werten übersehen werden, wenn der Übersetzer nicht sorgfältig auf die korrekte Verwendung von Morphemen achtet.

(2) Mehrdeutige Bezüge („es“, „dieser“)

Pronomen wie „es“, „dieser“, „diese“ oder „dieses“ können in Texten zu Mehrdeutigkeiten führen, insbesondere wenn der Bezugspunkt im Quelltext klar ist, aber im Zieltext durch die Übersetzung oder Satzumstellung unklar wird. Beispiele hierfür sind:

„Es“ könnte sich auf ein zuvor genanntes Subjekt, Objekt oder eine zuvor beschriebene Situation beziehen. In der Übersetzung muss sorgfältig geprüft werden, auf was sich „es“ genau bezieht, um Missverständnisse zu vermeiden.

„Dieser“ oder „jener“ kann in der Quellsprache einen klaren Bezug haben, der in der Übersetzung durch Veränderungen im Satzbau oder durch kulturelle Unterschiede in der Art und Weise, wie Bezüge hergestellt werden, verloren geht.

Die korrekte Zuordnung von Pronomen und ihre eindeutige Referenzierung sind essentiell, um die Kohärenz und Verständlichkeit des übersetzten Textes zu gewährleisten. Übersetzer müssen oft zusätzliche Informationen aus dem Kontext heranziehen oder den Satz umstrukturieren, um die Klarheit zu bewahren.

Diese erweiterten Beispiele unterstreichen die Notwendigkeit einer tiefgreifenden linguistischen Kompetenz und Aufmerksamkeit für Details in der Übersetzungsarbeit. Sie illustrieren, dass Übersetzer nicht nur Sprachkenntnisse, sondern auch ein umfassendes Verständnis für den Kontext und die spezifischen Anforderungen des Textes benötigen, um qualitativ hochwertige Übersetzungen zu liefern.

(3) Maßangaben und Zahlenformatierung

In technischen Texten sind präzise Maßangaben und korrekte Zahlenformatierung von entscheidender Bedeutung. Ein einfacher Austausch von Maßeinheiten wie Millimeter statt Meter oder Zoll statt Zentimeter oder Fahrenheit statt Celsius kann zu erheblichen Missverständnissen führen. Gleiches gilt für die korrekte Übernahme von Zahlen bzw. Umsetzung von Zahlenformatierungen, sei es eine Produktnummer oder ein Verweis auf ein bestimmtes Kapitel. Solche Fehler können leicht übersehen werden, insbesondere in Systemen mit hohen Fuzzy-Match-Werten.

(4) Verneinungen und ihr Risiko

Verneinungen sind ein weiterer sensibler Bereich in der Übersetzung. Ein fehlendes oder fälschlich übersetztes „nicht“ kann den Sinn eines Satzes vollständig verändern. Besonders bei längeren Sätzen kann das Wort „nicht“ leicht übersehen werden, da es vergleichsweise kurz ist. Solche subtilen Unterschiede können in Übersetzungen mit hohen Ähnlichkeitsgraden (im Bereich von 95 % oder mehr) schnell übersehen werden, insbesondere wenn der Übersetzer unter Zeitdruck steht.

(5) Zustandsangaben von Software oder Maschinen („eingeschaltet“, „ausgeschaltet“)

Zustandsangaben, die durch Präpositionen oder Partikel wie „on“ oder „off“, „ein“ oder „aus“, „links“ oder „rechts“ ausgedrückt werden, können ebenfalls zu Missverständnissen führen, wenn sie falsch übersetzt werden. Ein falsch verstandener Zustand kann erhebliche Auswirkungen haben, sei es in der Bedienungsanleitung eines Geräts oder in einer Softwareanwendung. Solche Nuancen müssen sorgfältig berücksichtigt werden, um die beabsichtigte Bedeutung des Textes korrekt zu vermitteln. Wir erinnern uns noch an den Fall einer chinesischen Übersetzung, die „Maschine EIN“ mit „Maschine Nr. 1“ übersetzen wollte.

Auch beim Prüfen fällt es dem Revisor schwer, diesen kleinen, aber gewichtigen Unterschieden auf die Spur zu kommen. Was also tun?

Strategien zur Minimierung von Fuzzy-Match-Risiken

Zuerst ist es wichtig, dieses potenzielle Problem und dessen Ursachen zu erkennen und zu verstehen. Darüber hinaus kann gezielt nach potenziellen Fehlern aus dem Gefahrenbereich (95-99 % Fuzzy Matches) gesucht werden: Wurden alle Verneinungen übersetzt? Sind alle Zahlen korrekt? Hier unterstützen Tools wie die Qualitätssicherungssoftware ErrorSpy dieses Prüfverfahren.

Trotz aller berechtigten Begeisterung für Technologien, die die Arbeit des Übersetzers optimieren und helfen, Geld und Zeit zu sparen, dürfen wir keine rosarote Brille aufsetzen. Technologien haben auch Nachteile. Sie zu kennen und zu verstehen, ist bereits der erste Schritt zu ihrer Beseitigung. Daher ist es unerlässlich, dass wir uns dieser Herausforderungen bewusst sind und entsprechende Maßnahmen ergreifen, um sie zu minimieren. Denn letztendlich kommt es auf jedes Detail an, wenn es um die Qualität von Übersetzungen und technischen Dokumentationen geht.

Zusätzlich zu den oben genannten Maßnahmen gibt es weitere Möglichkeiten, die Gefahren von Fuzzy-Matches zu reduzieren:

Übersetzer sollten sich der potenziellen Probleme von Fuzzy-Matches bewusst sein und diese sorgfältig prüfen, insbesondere, wenn der Ähnlichkeitsgrad hoch ist.

Strukturierung des Übersetzungsprozesses: Einen strukturierten Arbeitsablauf entwickeln, der klare Richtlinien für die Überprüfung von Fuzzy-Matches enthält. Dies beinhaltet auch die Festlegung von Standards für die Bearbeitung sensibler Bereiche wie Morpheme, Mehrdeutigkeiten und Maßangaben.

Unternehmen sollten ihre Übersetzer darin schulen, wie sie Fuzzy-Matches korrekt verwenden.

Unternehmen sollten vorsichtig sein, wenn sie Texte vorübersetzen oder veranlassen, Matches aus dem Translation-Memory nicht zu überprüfen.

Fortbildung: Die Sprache und die Fachbereiche entwickeln sich stetig weiter, und Übersetzer, Projektmanager und Auftraggeber sollten sich über aktuelle Entwicklungen, neue Terminologien und Fachpublikationen informieren. So können sie mit den sich ständig weiterentwickelnden Anforderungen des Übersetzungs- und Redaktionsbereichs Schritt halten.

Präzises Übersetzen will gelernt sein

Erfahrung, linguistische Kompetenz, sorgfältige Arbeitsweise, etablierte Verfahren, ausgereifte Tools sowie Qualifikationen und Zertifizierungen nach ISO 17100 bilden zusammen eine solide Basis, um die Risiken von Fuzzy Matches nicht nur zu erkennen, sondern auch effektiv zu managen. Diese Kombination aus menschlicher Expertise und technologischer Unterstützung bietet eine Art Sicherheitsnetz, das gewährleistet, dass Übersetzungsarbeiten mit höchster Präzision und Qualität durchgeführt werden.

Durch die Einhaltung der strengen Standards der ISO-17100-Zertifizierung, die spezifische Anforderungen an die Kompetenz von Übersetzern und den Übersetzungsprozess stellt, können Übersetzungsagenturen und -dienstleister sicherstellen, dass sie nicht nur Risiken minimieren, sondern auch die Effizienz und Konsistenz ihrer Übersetzungen maximieren. Auf diese Weise können die Vorteile von Fuzzy Matches mit der Gewissheit genutzt werden, dass die Qualität des Endprodukts stets gewährleistet ist.

Morphem

In der Sprachwissenschaft bezeichnet ein Morphem die kleinste bedeutungstragende Spracheinheit. Ein Morphem kann für sich allein stehen („freies Morphem“) oder ist Teil eines Wortes („gebundenes Morphem“) wie „un“ in „unschön“. Ein Wort kann mehrere Morpheme enthalten. Morpheme stellen für Übersetzer eine besondere Herausforderung dar („systemseitig = system+seit+ig“). Gebundene Morpheme sind z. B. Präfixe, Suffixe, Infixe. Für die praktische Arbeit von Übersetzern spielt das Verständnis von Morphemen eine wesentliche Rolle aus mehreren Gründen:

1. Wortbildung und -verständnis: Die Kenntnis darüber, wie Wörter durch verschiedene Morpheme gebildet werden, hilft Übersetzern, die Bedeutung komplexer Wörter zu entschlüsseln und adäquate Entsprechungen in der Zielsprache zu finden. Dies ist besonders wichtig bei der Übersetzung von Fachterminologie oder Neologismen, wo die Bedeutung oft aus den einzelnen Morphemen abgeleitet werden kann.

2. Sprachliche Feinheiten: Unterschiedliche Sprachen verwenden unterschiedliche Methoden der Wortbildung, was die Wahl der richtigen Übersetzung beeinflusst. Zum Beispiel kann eine Sprache ein Konzept durch Zusammensetzung ausdrücken (zusammengesetzte Nomen), während eine andere dafür Präfixe oder Suffixe verwendet. Ein tiefes Verständnis für Morpheme ermöglicht es Übersetzern, solche strukturellen Unterschiede zu erkennen und angemessen zu berücksichtigen.

3. Anpassung an den Kontext: Manchmal erfordert die Übersetzung eine Anpassung der Wortform an den grammatischen Kontext der Zielsprache, etwa hinsichtlich der Zeitform, des Geschlechts oder der Zahl. Das Verständnis der Morpheme, die solche grammatischen Funktionen tragen, ist entscheidend, um korrekte und natürliche Übersetzungen zu produzieren.

4. Konsistenz in der Terminologiearbeit: Bei der Arbeit mit Fachterminologie müssen Übersetzer oft entscheiden, wie neue Begriffe in der Zielsprache gebildet oder bestehende angepasst werden sollen. Ein fundiertes Wissen über Morpheme ermöglicht es, systematisch und konsistent bei der Wortbildung vorzugehen, was für die terminologische Konsistenz über ein Projekt hinweg entscheidend ist.

5. Kreativität und Problemlösung: In manchen Fällen gibt es keine direkten Entsprechungen zwischen den Sprachen. Übersetzer müssen dann kreativ werden und neue Wörter oder Ausdrücke bilden. Ein gutes Verständnis für Morpheme erlaubt es, solche neuen Begriffe sinnvoll und nachvollziehbar zu konstruieren, indem existierende Morpheme der Zielsprache kombiniert werden.

Das Verständnis von Morphemen und ihrer Funktion ist für Übersetzer wichtig, denn das hilft, die Nuancen der Ausgangssprache zu erfassen und präzise, kohärente und angemessene Übersetzungen in der Zielsprache zu erstellen.

Über den Autor

François Massion

Über den Autor

François Massion

Dr. François Massion ist Geschäftsführer der D.O.G. Dokumentation ohne Grenzen GmbH. Er hat einen Lehrauftrag im Bereich KI und NLU an der Shanghai Foreign Studies University. Er ist Mitglied im Fachbeirat des Deutschen Instituts für Terminologie e.V. (DIT).

fracois.massion@dog-gmbh.de, www.dog-gmbh.de

Diese Artikel könnten Sie auch interessieren:

Business Less Usual

Das jüngst veröffentlichte Fairwork-Ranking der Universität Oxford und des Wissenschaftszentrum Berlin (WZB) wirft ein Schlaglicht auf die ambivalenten Arbeitsbedingungen in unserer [...weiterlesen]

Business Less Usual