24. März 2011

Alignment-Strategien

Dem Alignment von Dokumenten habe ich bereits zwei Blog-Beiträge gewidmet (zu LF Aligner und AlignFactoryLight). Heute soll es ganz allgemein um „Alignment-Strategien“ gehen.

Bereits vor dem Alignment sind Überlegungen zum Zweck des Alignments anzustellen. Denn die Alignment-Vorarbeiten und die Alignment-Strategie richten sich auch danach, wie die durch das Alignment gewonnenen Übersetzungseinheiten (TUs) später genutzt werden sollen.

  1. Sollen die TUs als unveränderliche Referenz dienen?
  2. Oder sollen die TUs später durch eigene Übersetzungen aktualisiert werden?
  3. Soll eine TU immer möglichst viele Informationen beinhalten, da das aus dem Alignment hervorgegangene TM später eher als Referenz genutzt werden wird (Stichwort „Konkordanzsuche“)?
  4. Oder sollen die TUs den Segmentierungsregeln des eigenen CAT-Tools möglichst genau entsprechen, damit während des späteren Übersetzungsvorgangs möglichst viele vollautomatische Treffer aus dem durch das Alignment gewonnen TM erzielt werden?
  5. Sollen die TUs die neue deutsche Rechtschreibung berücksichtigen (auch wenn die Dokumente, beispielsweise EU- bzw. EG-Richtlinien aus den 70er oder 80er Jahren des vergangenen Jahrhunderts stammen)?
  6. Sollen sonstige orthografische Anpassungen am Ausgangs- bzw. Zieltext vorgenommen werden (z.B. amerikanisches oder britisches Englisch, Berücksichtigung von schweizerischen Sprachkonventionen, Entfernung überflüssiger Trennstriche, u.ä.)?

Vorarbeiten vor dem eigentlichen Alignment

Vor allem eine positive Antwort auf die Fragen 2, 5 und/oder 6 erfordert als Alignment-Vorbereitung die Rechtschreibprüfung des jeweiligen Dokuments (meist in Word) mit entsprechenden orthografischen Anpassungen und/oder auch die Anpassung sonstiger Satzzeichen (z.B. typografisch korrekte Anführungszeichen – sofern das Alignment-Tool sie nicht wieder durch gerade Anführungszeichen ersetzt) bzw. das Entfernen überflüssiger Trennstriche.

Selbst bei Texten der EU ist mitunter eine „Vorbehandlung“ notwendig, wie das folgende Beispiel zeigt („Spzialausschusses“ und „fortbesthenden“):

Sollen PDF-Dateien dem Alignment unterzogen werden (z.B. mit AlignFactoryLight), so ist eine solche Vorbearbeitung natürlich nicht möglich. In derartigen Fällen empfiehlt sich gerade bei AlignFactoryLight zunächst die Wahl des Ausgabeformats HTML-Bitext und dann die nachträgliche Rechtschreibprüfung der erstellten Alignment-Tabelle.

Segmentierungsregeln beim Alignment

Die Regeln, nach denen die Dokumente beim Alignment selbst segmentiert werden, lassen sich bei vielen Alignment-Werkzeugen einstellen. Dabei ist es oft wünschenswert, die Segmentierungsregeln des Alignment-Werkzeugs möglichst eng an die Regeln des eigenen CAT-Tools anzugleichen. Eventuell muss zu diesem Zweck die Liste der Zeichen, die das Segmentende signalisieren, angepasst und z.B. um „:“ und „;“ ergänzt werden.

Möglich ist auch eine absatzweise Segmentierung. Sie empfiehlt sich vor allem dann, wenn das durch das Alignment erzeugte TM vorwiegend als Referenz genutzt werden und bei der Durchsuchung per Konkordanzsuche möglichst viel Informationen pro TU bieten soll. Ein solches TM wird allerdings beim Übersetzen später in der Regel weniger automatische Treffer (100%-Entsprechungen und Fuzzy Matches) hervorbringen als ein TM mit satzweise segmentierten TUs.

Verarbeitbarkeit von Dokumentformaten durch das Alignment-Tool

Auf eine ganz grundlegende Frage sei abschließend noch hingewiesen: Welche Dokumentformate kann das Alignment-Tool überhaupt bearbeiten?

AlignFactoryLight bietet hier folgende Möglichkeiten: *.doc, *.docx, *.rtf, *.txt, *.html, *.xml, *.ppt, *.pptx, *.xls, *.xlsx, *.wpd, *.lwp, *.sam, *.pdf, *.prz und *.123.

Der LF Aligner kann die folgenden Dateiformate verarbeiten: *.txt, *.doc, *.docx, *.rtf, *.html und *.pdf.

Das Alignment-Werkzeug „PlusTools“, das Wordfast als Freeware anbietet und das in einem späteren Blog-Beitrag noch vergestellt werden soll, kann alle Formate bearbeiten, die direkt mit Word geöffnet werden können (*.doc, *.rtf, *.txt, *.html, *.xls usw.).

PS

Der vorstehende Text ist ein leicht abgewandelter Auszug aus meiner Online-Kompaktschulung zum Alignment von Dokumenten mit PlusTools und AlignFactoryLight auf www.wissenschadetnicht.eu.

1 Kommentar:

Torsten hat gesagt…

Ergänzend noch der Hinweis auf die LiveDocs-Funktion von memoQ, um diesen Bereich um eine weitere Facette zu erweitern: http://goo.gl/1y8Uf

Kommentar veröffentlichen