28. Februar 2012

TMX-Dateien teilen, bearbeiten, filtern

Von Auftraggebern oder Übersetzerkollegen empfangene TMX-Dateien kann man in sein CAT-Tool einspielen, klar. Man kann sie chronologisch lesen, mittlerweile auch bekannt :-).

Man kann TMX-Dateien aber auch in kleinere TMX-Dateien zerlegen, in andere Formate exportieren, in rein ausgangs- oder zielsprachige TXT-Dateien umwandeln, ihre Unicode-Codierung ändern oder auch die enthaltenen TUs filtern bzw. nachbearbeiten – das zumindest verspricht der TMX Editor von Logrus. Dieses kostenlose Tool für das TMX-Management liegt aktuell als Alpha-Version 0.99 vor und kann nach einer kurzen Registrierung von der Logrus-Website heruntergeladen werden.

Der in einer EXE-Datei untergebrachte TMX Editor ist im Grunde ein Tabelleneditor für TMX-Dateien. Er bietet folgenden Funktionsumfang:

Große TMX-Dateien in kleinere TMX-Dateien aufteilen

Große TMX-Dateien lassen sich beispielsweise in Dateien zu je 10 000 TUs splitten.

TMX-Dateien in andere Formate exportieren

Zur Auswahl stehen z.B. tabstoppgetrennte bilinguale TXT-Dateien im Unicode-Format oder TXT-Exportformat der „alten“ Translator’s Workbench. Weitere Formate sind:


Aber Achtung: Beim Speichern muss der Benutzer die Dateinamenerweiterung – also TMX oder TXT – selbst an den Dateinamen anhängen.

TMX-Dateien chronologisch lesen

Die TMX-Datei wird in Tabellenform dargestellt (hier in einem extrem schmalen Fenster, damit die Abbildung auf die Webseite passt):


Zunächst wird auch nicht die gesamte TMX-Datei angezeigt, sondern die Anzeige ist auf die ersten 2 000 TUs beschränkt:


Über das Tastaturkürzel Alt+L („Go to line number“) kann aber jede gewünschte Zeile direkt angesprungen werden. In der Detailansicht können die einzelnen TUs dann auch „vernünftig“ gelesen werden:



TUs nachbearbeiten

Zeichenketten in den Ausgangs- und Zielsegmentfeldern können gesucht und ersetzt werden – auch mit Hilfe regulärer Ausdrücke. Im Gegensatz zu Olifant kennt der TMX Editor von Logrus allerdings keine Eingrenzung auf einzelne Felder. Es ist also nicht wie bei Olifant möglich, die Suche nur auf den Ausgangstext oder nur auf den Zieltext zu beschränken. Ebensowenig ist es mit dem TMX Editor möglich, nur ganze Wörter suchen und ersetzen zu lassen.

TUs anhand der enthaltenen Attribute filtern

Es stehen benutzerdefinierte Filterfunktionen und folgende Standardfilter zur Verfügung:



XML- und RTF-Tags aus dem Text löschen

Folgende Optionen stehen zur Auswahl:



Die Codierung von TMX-Dateien ändern

Sehr große Dateien lassen sich mit dem separat mitgelieferten TMX Recoder (wTMXRecode.exe) von UTF-8 in UTF-16 umcodieren (und umgekehrt).