27. April 2012

Was steckt in der DGT-TM-Wundertüte?

Oder: „Wie ich einmal 1.917.637 TUs an einem Vormittag in mein CAT-Tool einspeiste“. Richtig erkannt, es geht wieder um das bereits gestern beschriebene DGT-TM-2011. ÜbersetzerInnen, die in ihren Texten auch nur im entferntesten mit der EU zu tun haben, tun gut daran, die im DGT-TM-2011 enthaltenen TMX-Dateien zu extrahieren und in ihr CAT-Tool einzubinden. Die 25 ZIP-Dateien enthalten für das Sprachenpaar Englisch-Deutsch 1.917.637 TUs - wertvollstes Kraftfutter für das CATzchen!

Wer den Aufwand einer Konvertierung des DGT-TM-2011-Gesamtbestands scheut und nur auf der Suche nach bestimmten alignten EU-Dokumenten ist, der kann anhand der Celex-Nummer des jeweiligen Dokuments schnell feststellen, ob das gesuchte Dokument im DGT-TM-2011-Fundus enthalten ist (und wenn ja, in welcher ZIP-Datei): Eine Übersicht über die Celex-Nummern aller im DGT-TM-2011 enthaltenen Dateien bietet meine ZIP-Dateienliste.

Ein kurzer Hinweis noch zur Aufbereitung der TMX-Dateien für das jeweilige CAT-Tool: Es wäre schade, wenn dabei vergessen würde, die Doc. No. (vulgo: Celex-Nummer) zu erhalten. Denn bei einer erfolgreichen Konkordanzssuche kann die Übersetzerin anhand der Celex-Nummer das Originaldokument rasch abrufen – am bequemsten durch die Eingabe dieser Nummer auf der Seite eur-lex.europa.eu/RECH_celex.do.

Keine Kommentare:

Kommentar veröffentlichen