TM 1: Grundlegende Eigenschaften von TM-Tools (2/10)

Regeln zur Segmentierung

Definition von Segmentgrenzen in DéjàVu X
©eCoLoTrain

Segmente im Déjà Vu X-Editor: jede Zelle der Tabelle beinhaltet ein Segment, abgegrenzt durch Satzzeichen, Wagenrücklauf (Return) oder Tabs
©eCoLoTrain

Die gleichen Segmente (wie in 2.1.2) in dem ursprünglichen Microsoft Word-Dokument.
©eCoLoTrain

Segmentierungsregeln sind Regeln für die Unterteilung von Texten in kleinere Einheiten (Segmente) durch sogenannte Segmentbegrenzer ("Sentence delimiters") (siehe Screenshot). Ein Segment kann definiert werden als "eine vordefinierte Texteinheit, die mit der dazugehörigen Übersetzung aligniert werden kann. Typischerweise ist die Grundeinheit einer Segmentierung ein Satz, jedoch können auch andere Einheiten als Segmente definiert werden wie Überschriften, Listeninhalte, Zellen einer Tabelle oder Abschnitte." (Bowker 2002, 152)

Im Dialogfeld Optionen, zeigt das Menü, das beim Linksklick erscheint, verschiedene Möglichkeiten für Segmentbegrenzer (Ziffern, Buchstaben, alle möglichen Zeichen, Leerzeichen, Zirkumflexe etc.), die Übersetzer verwenden können, um ihre eigenen Segmentierungsregeln und auch ihre eigenen Ausnahmefälle zu schaffen, und zwar abhängig von Textsorte oder Ausgangssprache.

Such-Algorithmen

Neues zu übersetzendes Segment. Nichts im TM -> Neue Wörter. "Je possède une voiture bleue que je partage avec mes parents."
©eCoLoTrain

Später findet sich im gleichen oder auch in einem anderen Text genau der gleiche Satz -> exakter Treffer. "Je possède une voiture bleue que je partage avec mes parents."
©eCoLoTrain

Dann erscheint im Ausgangstext ein ähnlicher, nur leicht modifizierter Satz. Nur ein verändertes Wort -> Fuzzy Match von 92%. "Je possède une voiture verte que je partage avec mes parents."
©eCoLoTrain

Mehrere Änderungen -> Fuzzy Match von 72%. "Je suis heureux de posséder une voiture bleue que je partage avec ma soeur."
©eCoLoTrain

Es handelt sich hierbei um Algorithmen (Computerprogramme), die Segmente im TM nachschlagen, um entweder identische Segmente ("exakte Treffer") oder ähnliche Treffer ("Fuzzy Matches") zu finden.

Normalerweise wird ein Fuzzy Match mit einem Übereinstimmungsgrad unter 75% von dem Translation Memory als neues Segment eingestuft. Diese Einstellung kann man natürlich ändern, jedoch wird empfohlen, dass die kleinstmögliche Übereinstimmung 75% betragen sollte, da bei einem niedrigeren Wert im Nachhinein ein höherer Übersetzungsaufwand notwendig ist. Tatsächlich kann es mehr Zeit in Anspruch nehmen, einen 75%-igen Fuzzy Match anzugleichen, als das Segment neu zu übersetzen.

Wenn jedoch nur ein kleines Translation Memory zur Verfügung steht, würde bei einem Schwellenwert von 75% die Anzahl an Fuzzy Matches drastisch reduziert. In solchen Fällen kann man den Wert auf bis zu 30% senken, um von solchen kleinen Datenbanken zu profitieren. Dies kann zum Beispiel im Übersetzungsunterricht der Fall sein, bei dem Studierende mit relativ kleinen oder leeren Translation Memories beginnen.

Terminologie-Komponente

Eine Terminologiedatenbank ermöglicht es dem Übersetzer, neue Begriffe einzugeben oder bereits erfasste Begriffe zu suchen. Die Suche erfolgt durch die Verwendung von Such-Algorithmen, welche die Begriffe innerhalb des Ausgangssegments suchen und sowohl "genaue" als auch "fuzzy" Matches finden können.

So können Begriffe, zu denen es bereits eine Übersetzung in der Terminologiedatenbank gibt, gefunden und in einem separaten Fenster angezeigt werden, auch wenn es noch keine passende Übersetzung für das vollständige Ausgangssegment im TM gibt. Diese können ganz einfach in das Zielsprachensegment eingefügt werden.

Analyse und Statistik

Ergebnisse einer Analyse in Déjà Vu X mit "exakten Treffern", "Duplikaten" (Wiederholungen, d.h. Segmente, die im gleichen Ausgangstext mehrfach auftreten), "Fuzzy Matches" (mit unterschiedlichem Grad an Übereinstimmung) und "kein Treffer" (Segmente, für die im TM keine Übereinstimmung gefunden wurde)
©eCoLoTrain

Analyse und Statistik können zu Beginn eines Übersetzungsprojekts verwendet werden, um statistische Daten zu erfassen wie die Wortanzahl des zu übersetzenden Texts und die Anzahl der genauen Treffer und Fuzzy Matches, die das für das Projekt ausgewählte TM beinhaltet. Um diese Funktionen einsetzen zu können, muss das für das Projekt zu verwendende TM entweder in der Projekt-Definition spezifiziert (z.B. im Fall von Déjà Vu X) oder in einem TM-Tool (z.B. in Trados) geöffnet werden, bevor die Anzahl der Matches berechnet werden kann.

Alignment-Komponente

Alignment einer Ausgangsdatei und ihre Übersetzung mit Trados WinAlign: Das Alignment wird mit dem Alignment-Tool durchgeführt. Das Ergebnis kann dann bearbeitet werden, indem Segmentpaare getrennt und verbunden werden, oder auch indem Segmente in Ausgangs- und Zielsprache geteilt und zusammengefügt werden. Text-Alignment basiert auf den gleichen Segmentierungsregeln, die bei der Suche von Übersetzungseinheiten im TM während einer Übersetzung angewendet werden.
©eCoLoTrain

Diese Komponente wird verwendet, um TMs aus früheren Übersetzungsprojekten zu erstellen, von denen es Ausgangstexte und dazugehörige Übersetzungen gibt. Die Alignment-Komponente versucht, Entsprechungen zwischen Ausgangs- und Zielsegmenten zu finden und sie zu Übersetzungseinheiten zu verbinden, die von bestehenden TMs oder bei der Schaffung von neuen TMs verwendet werden können.

Dieser automatische Prozess kann manuell verbessert werden. Vergessen Sie trotzdem nicht, dass es sich bei Alignment um ein Produktivitätstool handelt und somit möglichst wenig Aufwand erfordern sollte. Außerdem sollte man vor dem Alignment von Dokumenten darüber nachdenken, inwiefern sie für die künftige Arbeit relevant sein können.

Grundlegende Eigenschaften von TM-Tools (2/10)

Einige grundlegende Eigenschaften von Translation Memory-Tools sind:

Regeln zur Segmentierung

Such-Algorithmen

Terminologie-Komponente

Analyse und Statistik

Alignment-Komponente

Kurse

Leitfäden

Kontakt