NMÜ und CAT – der Markt und die Technologie: Wo geht die Reise hin?

Beitrag von Thomas Imhof  | Veröffentlicht am 14. April 2023  

Der Terminus „Digitalisierung“ im Sinne der digitalen Transformation von Wirtschaft, Staat, Gesellschaft und Alltag ist - gerade auch vor dem Hintergrund der Coronavirus-Pandemie und der damit verbundenen flächendeckenden Einführung des Home-Office - nach wie vor in aller Munde. Im Vergleich zum Rest des Landes ist die Übersetzungsbranche hier bereits sehr weit, denn in der Sprachindustrie hat die Digitalisierung bereits vor einigen Jahren stattgefunden, was auch einer der Gründe dafür sein dürfte, dass unsere Branche vergleichsweise gut durch die Pandemie gekommen ist.

Übersetzungsaufträge wurden bereits vor Beginn der Pandemie schon lange nicht mehr per Post oder Fax und in Form von Papier versandt, sondern kommen als E-Mail oder WhatsApp-Nachricht auf den Rechner, und die allermeisten Übersetzerinnen und Übersetzer arbeiten sowieso schon seit Jahren im Home-Office und haben die eigene digitale Infrastruktur längst im produktiven Einsatz. Damit unterscheidet sich die Übersetzungsbranche grundlegend von anderen Wirtschaftszweigen, wo bis zum Beginn der Pandemie noch Anwesenheitspflicht im Büro herrschte und Heimarbeitsplätze erst noch geschaffen werden mussten. Unterstützt wurde dieser frühe Trend zur Digitalisierung in der Übersetzungsindustrie durch die Entwicklung spezieller Software bereits seit den späten 1980er Jahren.

Evolution

Blickt man zurück, so lassen sich einige wichtige Evolutionsschritte feststellen: Den Startpunkt der Entwicklung markiert die Ablösung der Schreibmaschine durch den PC, der, ausgerüstet mit entsprechenden Textverarbeitungsprogrammen, eine große Erleichterung beim Erzeugen von Text darstellte. Flankiert wurde diese Entwicklung von der allgemeinen Verfügbarkeit des Internets und der Umwandlung vieler Textquellen in digitale Formate, was Übersetzerinnen und Übersetzer ganz neue Recherchemöglichkeiten eröffnete.

Als weiteren wichtigen Meilenstein lässt sich in den frühen 1990er Jahren die Erfindung des Translation Memory (oder kurz TM) nennen, einer Satzdatenbank zum Speichern von Sätzen und deren Übersetzungen, welche das Nachschlagen von Formulierungen und Fachwörtern in alten Referenzdokumenten und anderen Nachschlagewerken überflüssig machte. Die Verwendung von TMs führte zu einer massiven Zeitersparnis bei der Übersetzung repetitiver Inhalte. Kein Wunder also, dass das Translation Memory schon bald einen wahren Siegeszug antrat und dass heute kaum ein Übersetzungsprojekt ohne die Verwendung dieser Datenbanken auskommt. TMs sind aus den Übersetzungsprozessen heutzutage schlicht nicht mehr wegzudenken und bilden einen zentralen Bestandteil sog. CAT-Tools (CAT = computer-assisted translation) - spezieller Software-Lösungen für Übersetzerinnen und Übersetzer, die eine Editierumgebung mit Datenbank-Recherchemöglichkeiten aber auch Projektmanagementfunktionen in einem Softwareprodukt zusammenfassen. Bald darauf wurde der Zugriff auf die Translation-Memory-Datenbanken über entsprechende Serverlösungen zentralisiert, um die zeitgleiche Arbeit mehrerer Übersetzerinnen und Übersetzer mit den gleichen Datenbanken zu ermöglichen, was zu einer verbesserten Konsistenz der Übersetzungen und damit zu einer Optimierung der Übersetzungsqualität und einer weiteren Verringerung der Zeitaufwände führte.

Cloud

Wie sehr das Cloud-Computing bereits Einzug in unser tägliches Leben und auch in unsere Arbeitswelt Einzug gehalten hat, sehen wir vielleicht am ehesten, wenn wir unser Mobiltelefon einschalten, denn allermeisten der dort installierten Apps sind nichts anderes als Konnektoren in die dahinterliegenden Cloud-Systeme - sei es Navigation, Chat, soziale Medien, Massenspeicher wie Dropbox und OneDrive usw. – in deren Hintergrund immer die Server der Betreiber werkeln. Wir bezahlen diese Services auf die eine oder andere Art und Weise, oftmals, indem wir Werbung über uns ergehen lassen oder indem wir unsere eigenen Daten zur Verfügung stellen, um sie mit anderen zu teilen, aber auch ganz klassisch über entsprechende Nutzungsverträge oder Abonnements mit den Betreibern.

Die allermeisten CAT-Tools-Hersteller bieten heute nicht mehr nur die klassischen Desktop-Varianten ihrer Lösungen an, sondern verlagern mehr und mehr Funktionalität auf spezielle Cloud-Server, die flexibel abonniert und mittels Webbrowser bedient werden und damit plattformunabhängiges Arbeiten ermöglichen. So bieten fast alle Hersteller Projektmanagementfunktionen und Übersetzungseditoren an, die über alle wichtigen Funktionen verfügen und komplett im Browser ausführbar sind. Dadurch werden die Übersetzerinnen und Übersetzer weitgehend unabhängig von der Verwendung des eigenen PCs - die Arbeit kann heute an jedem beliebigen Endgerät durchgeführt werden, solange dort ein Browser installiert ist. Sprachendienste und Übersetzungsdienstleister schätzen gleichermaßen die vereinfachten Funktionen zum Teilen von Projektdaten wie auch die minimierten Rollout- und Betriebskosten, denn es muss bei einem Cloud-basierten System keine Hardware mehr gekauft und keine Software mehr installiert und gewartet werden.

NMÜ

Eine neue Dimension erreicht das Cloud-Computing in der Übersetzungsbranche neuerdings durch die inzwischen alltagstauglich gewordene neuronale maschinelle Übersetzung (NMÜ). Hier werden Sprachpaare von einem neuronalen Netz mit Hilfe von Deep-Learning-Methoden trainiert, wobei Zusammenhänge zwischen Ausgangs- und Zielsprache im Trainingskorpus erfasst werden. Anschließend können diese dann auf ähnliche linguistische Zusammenhänge angewandt werden. Mittels BLEU (bilingual evaluation understudy) lässt sich zudem bewerten, inwieweit die Übersetzungsqualität durch das Training verbessert werden konnte.

Wurde maschinelle Übersetzung durch herkömmliche statistische oder regelbasierte MÜ-Systeme bis vor wenigen Jahren noch milde belächelt und von vielen Übersetzerinnen und Übersetzer als unbrauchbar abgelehnt, so hat sich die Übersetzungsqualität durch die Einführung von künstlicher Intelligenz (KI) und den damit verbundenen Deep-Learning-Methoden in den letzten Jahren massiv verbessert. NMÜ-Systeme sind mittlerweile - zumindest für die Standardsprachrichtungen - weit verbreitet und haben einen ähnlich großen Einfluss auf die Produktivität bei der Übersetzung wie die Translation-Memory-Datenbanken. Zumindest bei den gängigen Sprachpaaren ist die Übersetzungsqualität der NMÜ-Systeme mittlerweile so gut, dass sie dem Translation Memory als wichtigste unterstützende Technologie ernsthaft Konkurrenz machen können.

Allerdings stellt sich der Betrieb und vor allem das Training eines NMÜ-Servers nach wie vor sehr kostenintensiv dar. So muss für das Training eine moderne 3D-Grafikkarte installiert sein, deren Anschaffungskosten oftmals im fünfstelligen Bereich liegt. Rechnet man dann noch die Betriebskosten und weitere Softwarekosten dazu und möchte man eine ausfallsichere Lösung, so landet man sogar bei sechsstelligen Beträgen. Das sind Summen, die die Installation eines solchen Systems auf dem eigenen Rechner oder im eigenen Netzwerk unattraktiv machen.

Was also liegt näher, als ein NMÜ-System in Form eines Cloud-Services anzubieten? Übersetzerinnen und Übersetzer können diese NMÜ-Systeme genau wie andere Cloud-Dienste bei Bedarf flexibel abonnieren. Je nach Art des Abonnements bieten einige Hersteller sogar an, das System mit den eigenen Translation-Memory-Daten zu trainieren, um die Übersetzungsqualität zu optimieren. Andere Hersteller bieten adaptive Systeme an, die ähnlich wie das Translation Memory bei der Arbeit mitlernen.

Anbieter von Cloud-basierten MÜ-Systemen sind in den letzten 4 bis 5 Jahren wie Pilze aus dem Boden geschossen - GoogleMT, DeepL und Bing Microsoft Translator sind nur einige der bekannten Namen in diesem Sektor. Wie viele unterschiedliche Anbieter es im Markt derzeit gibt, lässt sich vielleicht am ehesten erschließen, wenn man die MÜ-Plug-Ins im RWS App-Store für Trados Studio zählt. Dort finden sich sage und schreibe 47 Plug-Ins für die allermeisten der im Markt miteinander konkurrierenden Systeme.

NMÜ & CAT

Die modernen CAT-Tools ihrerseits implementieren - ähnlich wie das Betriebssystem auf den Smartphones - die Schnittstellen zu diesen MÜ-Cloud-Diensten und binden die maschinelle Übersetzung zusätzlich zu den klassischen Translation-Memory-Datenbanken in die Übersetzungsprojekte ein. Oft wird dabei das Translation Memory als primäre Übersetzungsquelle eingestellt, das MÜ-System kommt an zweiter Stelle und meldet sich nur dann zu Wort, wenn im TM nichts Passendes gefunden wird.

So können ganze Projekte maschinell vorübersetzt und anschließend im Übersetzungseditor mittels Post-Editing nachbearbeitet werden. Alternativ kann in einigen CAT-Umgebungen die maschinelle Übersetzung auch selektiv verwendet werden, um nur Satzteile oder einzelne Wörter übersetzen zu lassen oder um unscharfe TM-Treffer automatisch so anzupassen, dass sie wieder in den Zusammenhang passen und keine Nachbearbeitung des Fuzzy-Matches notwendig ist. Das funktioniert sowohl mit Desktop-basierten CAT-Tools, den klassischen Serverlösungen als auch mit den modernen Cloud-Lösungen der Hersteller bereits sehr gut. NMÜ trägt so zur erneuten Steigerung der Produktivität bei und erlaubt die Übersetzung großer Textmengen in einer sehr kurzen Zeit.

Erwähnenswert ist auch, dass die Terminologiearbeit, die ja lange Jahre ein eher bescheidenes Dasein gefristet hat, vor dem Hintergrund der Trainierbarkeit - nicht nur von MÜ-Systemen, sondern ganz allgemein von KI-Systemen - derzeit eine Renaissance erfährt. Viele Firmen arbeiten momentan daran, ihre Terminologie auf Vordermann zu bringen und „KI-fähig“ zu machen.

Grenzen und Herausforderungen

Natürlich ist dort, wo viel Licht ist, auch der unvermeidliche Schatten zu finden - viele Fragen zum Thema maschinelle Übersetzung bleiben nach wie vor ungeklärt. So gibt es beispielsweise noch keine allgemeingültige Antwort auf die Frage der Abrechnung maschinell erstellter Übersetzungen, denn der klassische Ansatz, auf Zeilen- oder Wortbasis abzurechnen, lässt sich auf die maschinelle Übersetzung nur bedingt anwenden. Eine andere Herausforderung ist die Datensicherheit - denn alles, was an die NMÜ-Systeme geschickt wird, kann theoretisch in falsche Hände geraten. Hier gilt es also mit dem gleichen Maß an Vorsicht zu agieren wie bei der Verwendung der klassischen Cloud-Angebote.

Auch erfordert das Post-Editing von maschinell erstellten Übersetzungen ganz andere Fähigkeiten als die eigentliche Übersetzung - die NMÜ-Systeme liefern zwar in den allermeisten Fällen gut formulierten und lesbaren Text zurück. Allerdings machen sie Fehler bei der Zeitenfolge und können Bezüge zwischen Sätzen oft nicht sauber abbilden, von linguistischen Nuancen wie Ironie, Humor, Wortspielen usw. einmal ganz abgesehen. Diese subtilen Fehler in einer maschinell erstellten Übersetzung zu finden und zu beheben, erfordert oftmals mehr Zeit und Konzentration, als den Text von Anfang an selbst zu übersetzen.

Besonders bei weniger gängigen Sprachrichtungen zeigen sich auch schnell die Grenzen der NMÜ - denn die Systeme müssen vorab mit bilingualen Referenzdaten trainiert werden. Dabei steht im Internet für die gängigen Sprachrichtungen ein schier unerschöpflicher Schatz an qualitativ hochwertigem und frei verfügbarem bilingualen Referenzmaterial zur Verfügung. Für seltenere Sprachrichtungen sieht das allerdings ganz anders aus. Daher ist die Übersetzungsqualität bei solchen Sprachrichtungen nach wie vor eher suboptimal, und oft werden seltenere Sprachrichtungen von den Betreibern erst gar nicht angeboten. Hinsichtlich Leistungsfähigkeit und Übersetzungsqualität ist bei dieser recht jungen Technologie also noch Luft nach oben, und wir können damit rechnen, dass diese Kinderkrankheiten in den kommenden Jahren Schritt für Schritt behoben werden und die NMÜ bald genau wie Translation Memory, Translation Management und andere Technologien standardmäßig zur Produktivitätssteigerung beim Übersetzen eingesetzt wird. Übersetzungsdienstleister werden neue Geschäftsmodelle mit dieser neuen Technologie entwickeln, und es ist absehbar, dass eine vom Menschen angefertigte Übersetzung in Zukunft ein Premiumprodukt sein wird, während die maschinell angefertigte Übersetzung ein günstigeres Marktsegment ansprechen wird, wo die Übersetzungsqualität weniger wichtig ist als der Zeitfaktor.

Blick in die Glaskugel

Was aber bedeutet das für den Übersetzerberuf? Der Einsatz von NMÜ wird sicherlich nicht dazu führen, dass der Übersetzerberuf ausstirbt - auch wenn das immer wieder prophezeit wird. Allerdings wird sich die Arbeitsweise von Übersetzerinnen und Übersetzern ändern. Der Bedarf für Post-Editing wird steigen, und der Bedarf für Humanübersetzungen wird zurückgehen. Das könnte dazu führen, dass der Übersetzerberuf an Attraktivität einbüßt und sich dadurch weniger junge Menschen entschließen werden, ihn zu erlernen.

Gleichzeitig steigt aber der Bedarf an Übersetzungen nach wie vor stetig an, weil auch die zu übersetzende Textmenge weltweit nach wie vor stetig wächst. Ohne NMÜ wären die Textmengen, die übersetzt werden müssen, bereits heute von menschlichen Übersetzern nicht mehr zu bewältigen, und dieser Trend wird sich fortsetzen. Wendet man die marktwirtschaftlichen Grundsätze von Angebot und Nachfrage auf diese Situation an, so wird schnell klar, dass sehr wahrscheinlich gute Zeiten auf uns Übersetzerinnen und Übersetzer zukommen werden, denn einerseits verlagert sich der Kern unserer Tätigkeit in ein Premium-Segment, und andererseits werden weniger Ressourcen zur Verfügung stehen, um dieses Premium-Segment zu bedienen. Gleichzeitig wird es einen steigenden Bedarf im mittleren Preissegment geben, wo immer mehr maschinell übersetzte Texte nachbearbeitet werden müssen.

Sicher ist jedenfalls, dass auch mittel- bis langfristig genug Arbeit für Übersetzerinnen und Übersetzer vorhanden sein wird.

Über den Autor

Thomas Imhof

Über den Autor

Thomas Imhof

Nach abgeschlossenem Studium zum Diplom-Übersetzer in Heidelberg und einer ersten Station im Sprachendienst der Mannesmann Demag war Thomas Imhof ab 1998 u. a. Produkt-Manager und später Leiter des europäischen Kundenservice bei der Trados GmbH in Stuttgart. Anfang 2009 gründete er localix.biz - language technology consulting in Hamburg. Seit 2019 ist er bei der docConsult GmbH für den Bereich Professional Services zuständig.

Diese Artikel könnten Sie auch interessieren:

Business Less Usual

Das jüngst veröffentlichte Fairwork-Ranking der Universität Oxford und des Wissenschaftszentrum Berlin (WZB) wirft ein Schlaglicht auf die ambivalenten Arbeitsbedingungen in unserer [...weiterlesen]

Business Less Usual