6. Dezember 2010

LF Aligner - der Alignment-Saga erster Teil

Um einiges direkt am Anfang klarzustellen:
Zur Übersetzungsvorbereitung halte ich das Alignment von Referenzunterlagen für nützlich (wegen der insgesamt zu erzielenden Zeitersparnis) und auch für notwendig (wegen der Einhaltung von Kundenvorgaben und der Verbesserung der Übersetzungsqualität). Und ich gebe zu, ich bin ein Fan von AlignFactoryLight aus dem Hause Terminotix, aber das ist Thema eines anderen Blogbeitrags (der noch in der Mache ist).

Mitte November 2010 veröffentlichte András Farkas auf sourceforge.net den LF Aligner als neues kostenloses Alignment-Programm. Aus Neugier habe ich es getestet.

Vorab das Allerwichtigste in aller Kürze:

  • Alignment von DOC-, DOCX-, TXT-, PDF- und HTML-Dateien
  • Ausgabeformate: TXT, TMX und XLS
  • Stapelverarbeitung möglich
  • läuft auf Windows-, Mac- und Linux-Betriebssystemen
  • Alignmentprozess basiert auf hunalign
  • EU-Dokumente können anhand der CELEX-Nummer automatisch heruntergeladen und verarbeitet werden
  • das große Plus: das automatische Alignment liefert sehr gute Ergebnisse
  • ein weiteres großes Plus: der LF Aligner ist kostenlos
  • das große Minus (aus meiner Sicht):
    die Kommandozeilenbenutzung bremst (allerdings können Voreinstellungen in der Datei LF_aligner_setup.txt eingetragen werden),
    und das Programm beinhaltet keinen eigenen Alignment-Editor

Und jetzt etwas ausführlicher mein Testbericht:

Der LF Aligner ist ein Kommandozeilenprogramm. Wer also Angst vor schwarzen Konsolenfenstern hat, der lässt wohl besser die Finger von diesem Tool, auch wenn der Benutzer (auf Englisch) Schritt für Schritt angeleitet wird.

Das Lesen der Kommandozeilenanweisungen ist etwas gewöhnungsbedürftig. Es hemmt die zügige Erledigung von Alignmentaufgaben zunächst, doch mit ein paar gefahrenen Alignments geht die Eingabe der Anweisungen dann doch einigermaßen flott von der Hand. Natürlich wäre aber das Anklicken von Optionen in einem Kombinationsfeld oder einer Drop-down-Liste noch schneller.

Obwohl die Kommandozeilenanweisungen aussagekräftig sind, empfiehlt sich auf jeden Fall die Lektüre der rund zehnseitigen Anleitung des Programms (LF_aligner_readme.txt).

Im Laufe des Alignment-Prozesses erwartet der LF Aligner folgende Benutzereingaben:

  • Angabe des Dateityps: DOC, DOCX, RTF, TXT (UTF-8), PDF oder HTML (auf dem eigenen Computer oder als Internetadresse); außerdem können EU-Dokumente über die CELEX-Nummer und andere Dokumentnummern direkt aufgerufen werden
  • Ausgangssprache (als Kürzel)
  • Zielsprache (als Kürzel)
  • Name des Ausgangsdokuments (das Dokument kann auch mit Drag&Drop in das Kommandozeilenfenster gezogen werden – außer bei Windows Vista)
  • Name des Zieldokuments (das Zieldokument muss im selben Ordner wie das Ausgangsdokument liegen, zumindest bei Word-Dokumenten)
  • Entscheidung, ob der Text segmentiert werden soll (oder ob Absätze als Segmente dienen sollen)
  • Entscheidung, ob das Segmentierungsergebnis beibehalten werden soll (angezeigt wird hier die Zahl der erzeugten Ausgangs- und Zieltextsegmente)
  • Entscheidung, ob die Platzhalter („ ~~~ “), die der LF Aligner für die Verbindung mehrerer Sätze (oder Satzfragmente) zu einem Segment eingefügt hat, wieder gelöscht werden sollen
  • Entscheidung, ob der Benutzer das Ergebnis des automatischen Alignments überprüfen will (Optionen: keine Überprüfung; Überarbeitung des TXT-Datei, beispielsweise mit PlusTools; Überarbeitung des Alignment-Ergebnisses in Excel, wobei der Benutzer den relevanten Ausschnitt der XLS-Datei in den Zwischenspeicher kopieren und danach in eine TXT-Datei einfügen muss)
  • Entscheidung, ob eine TMX-Datei erzeugt werden soll
  • bei Erzeugung einer TMX-Datei:
    Angabe des Sprachkürzels der Ausgangssprache,
    Angabe des Sprachkürzels der Zielsprache,
    Eingabe des Datums,
    gegebenenfalls Eingabe des Erstellers
    und
    gegebenenfalls Angabe eines Kommentars (z.B. Dokumentname)

So, für alle BlogleserInnen, die bis hierhin durchgehalten und ihre Lesebrille noch nicht ins Korn geworfen haben, kommen jetzt noch ein paar Dinge, die bei meiner Testreihe danebengingen sind oder die ich als störend empfand:

  • Der Alignment-Prozess wurde plötzlich beendet, und zwar an der Stelle, an der der LF Aligner eigentlich fragt, ob die Platzhalter („ ~~~ “) gelöscht werden sollen. Dieses Verhalten war mit bestimmten Dateipaaren reproduzierbar.
  • Das „€“-Zeichen wird in „Euro“ umgewandelt, allerdings nur, wenn DOCX-Dateien verarbeitet werden – bei DOC-Dateien tritt das Problem nicht auf. Das Ergebnis ist nicht so schön: British Airways lost Pound292m (Euro347m) in the six months to the end of September [...]. Hier musste ich in Word manuell nacharbeiten.
  • Störend ist auch die Umformung von Hyperlinks, beispielsweise in info@company.com [HYPERLINK: mailto:info@company.com].
  • Verwirrend ist die Erzeugung von zwei fast identischen Dateien namens aligned_ASText-ZSText.txt und aligned_ASText-ZSText_mod.txt [der Dateinamenteil „ASText-ZSText“ ist hier nur ein Beispiel]. Der Nutzer darf selbst raten, welche Datei nun das Alignmentergebnis ist.
  • Am stärksten gestört hat mich aber die Tatsache, dass für den Ausgleich von Fehlzuordnungen bei Einzelsegmenten keine komfortable und sofort nutzbare Hilfe angeboten wird. Das Auschneiden und Einfügen von Text in Excel ist eine sehr umständliche Lösung (außer wenn es um das Löschen von ganzen Spalten geht). Die Bearbeitung der TXT-Datei ist eine Alternative: Die Umwandlung des durch Tabstopps getrennten Textes in eine Wordtabelle ist schnell erledigt, doch das Zusammenführen von zwei oder mehr Zellen zu einer Zelle ist in Word ohne sonstige Hilfsmittel nicht praktikabel. Der Programmautor András Farkas schlägt hier das kostenlose PlusTools von Wordfast vor, das für diese Aufgabe in der Tat gut geeignet ist. Die nötigen Vorarbeiten (Tabelle erzeugen, Datei als DOC/DOCX abspeichern) muss der Benutzer allerdings selbst leisten, und er sollte sich auch das nötige PlusTools-Wissen durch das Studium der LF-Aligner-Anleitung aneignen.

Der LF Aligner ist nicht mit einem eigenen Alignment-Editor ausgestattet, da András Farkas von den bereits sehr guten Ergebnisse des automatischen Alignments überzeugt ist (die Qualität ist tatsächlich außerordentlich gut).
Er ist der Meinung, die Nachkontrolle und die manuelle Korrketur von Fehlzuordnungen seien in den meisten Fällen entbehrlich. Dieser Meinung schließe ich mich nicht an: Wenn ich mir schon die Mühe mache und die Eingabeaufforderungen des Programms brav abarbeite, dann muss auch noch die Zeit sein, um das Alignmentergebnis zu kontrollieren und gegebenenfalls zu korrigieren. Der Qualitätsgewinn wird sich in einer höheren Zuverlässigkeit der späteren TM-Vorschläge und damit einer schnelleren – und oft auch besseren – Übersetzung niederschlagen.

Fazit

Für den sporadischen Nutzer ist der anfängliche Zeitaufwand für die Bedienung des Programms relativ hoch. Der finanzielle Aufwand ist dagegen null. Und da es ein relativ neues Programm ist, sind auch für die nähere Zukunft noch einige Verbesserungen zu erwarten.

Wer ernsthaft mit dem Programm (das noch deutlich mehr als die vorgestellten Funktionen bietet) arbeiten will, sollte auf jeden Fall die sehr informative Bedienungsanleitung lesen, aber das ist ja selbstverständlich.