Pre-Editing – Unsere top 5 Empfehlungen für bessere maschinelle Ergebnisse

In einigen Fällen lassen sich beim Einsatz von maschinellen Übersetzungsengines bereits gute Ergebnisse erzielen. Erfahren Sie in diesem Artikel, wie Sie Ihr Material schon in der Redaktionsphase maschinenfreundlicher gestalten können, um sich Aufwände, Kosten und Ärger bei der maschinellen Übersetzung zu sparen.

Welche Textsorten sind besonders geeignet für maschinelle Übersetzungsworkflows?

So individuell Texte grundsätzlich sind, lässt sich doch pauschal sagen, dass sich einige Textsorten besser zur maschinellen Übersetzung eignen als andere. Eher geeignet sind Texte, die allgemeinen Textsortenkonventionen folgen, die der Maschine entgegenkommen.

  • Texte aus dem Bereich E-Commerce, bspw. (computergenerierte) Webshops, Artikelbeschreibungen mit hoher Informationsdichte oder Produktdatenblätter, sind oft sehr strukturiert und folgen einem einheitlichen, wenig komplexen Schema. Kurze Sätze ohne ausschweifende Nebensatzkonstruktionen sind hier Standard.
  • Auch bei Betriebsanleitungen und technischer Dokumentation handelt es sich redaktionell betrachtet um stark regulierte bzw. reglementierte Texte mit einem hohen Anspruch an Präzision, Eindeutigkeit und Verständlichkeit. Prägnante, vollständige Sätze – teilweise auch wiederkehrende Formulierungen, wenn Bauteile wiederholt explizit genannt werden – machen es der Maschine leichter, Bezüge zu erkennen. In einer gut geschriebenen Betriebsanleitung muss man nicht zwischen den Zeilen lesen und es gibt keinen Interpretationsspielraum, weshalb sich diese Texte eher für die maschinelle Verarbeitung eignen.
  • Ein hoher Allgemeinsprachlichkeitsgrad kommt der Maschine in jedem Fall entgegen, im Gegensatz zu einem hohen Fachlichkeitsgrad, der umfangreiche Terminologievorgaben mit sich bringt und ein vorgelagertes kundenspezifisches Terminologietraining der Maschine erfordert. Dementsprechend kommen auch einfache benutzergenerierte Inhalte wie Produktbewertungen, Feedbacks, Kommentarspalten für maschinelle Übersetzungen infrage – vorausgesetzt, grundlegende Sprachkonventionen wie Rechtschreibung und Grammatik werden beachtet.
  • Auch informelle interne Schreiben, die eher einen Informationscharakter haben, statt repräsentative Zwecke oder Marketingziele zu verfolgen, können effizient maschinell übersetzt werden. Dazu gehören z. B. Newsbeiträge, Personalmeldungen, E-Mails, Aushänge, Intranet-Beiträge, Protokolle und einfache Präsentationen.

So verbessern Sie Ihr maschinelles Übersetzungsergebnis

Wenn Sie den Workflow für Ihre Texte, von der Erstellung bis zur Veröffentlichung, schon bei Projektstart gedanklich durchspielen, können Sie bereits in der Redaktionsphase darauf achten, maschinenfreundlich zu schreiben und sich damit später den Übersetzungsprozess erleichtern. Bedenken Sie hierbei folgende Punkte:

1. Korrekte Rechtschreibung beachten:

Achten Sie für maschinelle Verarbeitungszwecke insbesondere auf korrekte Rechtschreibung. Bedeutungsverändernde Tippfehler können für die Maschine im entsprechenden Satzzusammenhang eine unüberwindbare Hürde darstellen.

2. In sich geschlossene, vollständige Sätze formulieren:

Übersetzungsengines kommen mit klar zusammenhängend formulierten und zusammengehörig strukturierten Texten besser zurecht als mit jeglicher formatbedingten Unterbrechung (Ellipsen, harte Umbrüche o. Ä.). Gegebenenfalls gehen dann grammatische Bezüge, bspw. die korrekte deutsche Kasusendung, verloren:

Achten Sie auf in sich geschlossene Formulierungen, die für sich stehen können:

3. Doppeldeutigkeiten vermeiden:

Die Performance von maschinellen Übersetzungsengines variiert bzgl. Kontextsensitivität. Der Zusammenhang, in dem ein Begriff steht, wird mal besser und mal schlechter erfasst. Insbesondere im Fall von doppeldeutigen Begriffen, kann sich fehlender Kontext im Satz entscheidend auswirken, wie folgendes Beispiel verdeutlicht. Hier schwankt die Übersetzungsengine zwischen dem Kreditinstitut und der Sitzgelegenheit und entscheidet sich im oberen Beispiel letztlich falsch:

So klappt es besser:

4. Auf Abkürzungen verzichten:

Als Königsklasse bei der Verwendung von Abkürzungen haben wir der Engine den Klassiker „Mfg“ von den Fantastischen Vier vorgelegt. Hier wählt die Engine den Weg des geringsten Widerstands: Keine der Abkürzungen wurde übersetzt, obwohl bspw. für „DDR“ die etablierte englische Bezeichnung „GDR“ ist:

5. Wortspiele und Redewendungen vermeiden:

Dass Werbeslogans höchste Kreativität und sprachliche Raffinesse erfordern, ist bekannt. Eine maschinelle Übersetzungsengine wird sich aber auch bei weniger reißerischen Beispielen als dem folgenden immer an einzelnen Wortbestandteilen entlanghangeln und entsprechend sinnlose Ergebnisse hervorbringen. Unser Beispiel mit der Werbekampagne von Obi zeigt: Die Anspielung auf „Made in Germany“ konnte maschinell nicht ansatzweise transportiert werden:

Bei bildlichen Vergleichen und Sprichwörtern, die nicht in den Trainingsbestand der Engine eingeflossen sind, sieht das Ergebnis nicht besser aus. Maschinell erhalten Sie eine inhaltsidentische, wörtliche Übersetzung, die Ihr Zielpublikum ratlos zurücklassen dürfte:

Manche Formulierungen und Texteigenheiten lassen sich nicht vermeiden. Die Verwendung von Eigennamen oder einzelnen Abkürzungen erscheint Ihnen vielleicht unumgänglich. Falls Sie auf eigene Faust maschinell übersetzen, sollten Sie beim nachgelagerten Qualitätssicherungsschritt entsprechend sensibilisiert sein und mögliche Stolperfallen für die Übersetzungsengine im Zieltext noch einmal genauer unter die Lupe nehmen.

Wir beraten Sie jederzeit gerne zur Umsetzbarkeit Ihres maschinellen Übersetzungsvorhabens und unterstützen Sie bedarfsweise mit einem vollumfänglichen Post-Editing Ihres maschinellen Outputs. Sprechen Sie uns einfach an.