10. Juni 2014

Ergänzungsnahrung für das CATzchen

CATzchen leben vor allem von den Nährstoffen, das sie sich in Form von Translation Memories (TMs) angefressen haben. Einige nutzen auch Kraftfuttervorräte, auf die sie in Notzeiten zurückgreifen (ihre treusorgenden Frauchen lagern beispielsweise das DGT-TM-Korpus auf dem heimischen Rechner, damit das CATzchen zur Konkordanzsuche darüberlaufen und sich bedienen kann). Darüber hinaus nimmt so ein CATzchen auch gern Nahrungsergänzungsmittel an: Glossare, die die Zielgenauigkeit und Sprungkraft des CATzchens enorm verbessern. Und genau um ein solches Glossar soll es im Folgenden gehen, nämlich um EuroVoc.

Warum Glossare direkt in das CAT-Tool einbinden?

Alle bekannten CAT-Tools verfügen über die Möglichkeit Glossare einzubinden. Glossare enthalten kundenspezifische oder auch fachspezifische Terminologie – viele Übersetzer*innen führten sie früher auf Karteikarten, später als Word- oder Excel-Listen. Den vollen Nutzen entfalten solche Terminologiebestände aber nur bei einer möglichst reibungsarmen Einbettung in den Übersetzungsworkflow – wenn sie also durch das CAT-Tool automatisch abgefragt werden, damit die Übersetzerin die relevante Terminologie möglichst mit einem Klick in die aktuelle Übersetzung übernehmen kann.

Eine wichtige Voraussetzung dafür, dass die eingebundenen Glossare zur Beschleunigung der Übersetzungsarbeit und zur Steigerung der Übersetzungsqualität beitragen, ist natürlich die Zuverlässigkeit der enthaltenen Terminologie. Viele Übersetzer*innen pflegen handverlesene eigene Terminologiebestände, aber auch qualitativ hochwertige externe Datenbestände sind willkommen. Ein derartiger Terminologiebestand aus dem Netz, der als Excel-Tabelle auf den eigenen Rechner heruntergeladen und somit relativ problemlos in ein CAT-Tool eingebunden werden kann, ist:

EuroVoc 4.4

Das Amt für Veröffentlichungen der Europäischen Union verwaltet EuroVoc. Laut Aussage der EuroVoc-Website ist EuroVoc „ein mehrsprachiger multidisziplinärer Thesaurus, der die Terminologie der Tätigkeitsbereiche der Europäischen Union abdeckt, wobei der Schwerpunkt auf der parlamentarischen Tätigkeit liegt. EuroVoc ist verfügbar in den 23 Amtssprachen der Europäischen Union (Bulgarisch, Dänisch, Deutsch, Englisch, Estnisch, Finnisch, Französisch, Griechisch, Italienisch, Kroatisch, Lettisch, Litauisch, Maltesisch, Niederländisch, Polnisch, Portugiesisch, Rumänisch, Schwedisch, Slowakisch, Slowenisch, Spanisch, Tschechisch und Ungarisch) und in der Sprache eines weiteren Landes (Serbisch)“. Derzeit enthält EuroVoc knapp 6 900 Einträge – offensichtlich in allen Sprachen.

Der EuroVoc-Datenbestand kann in unterschiedlichen Formen und Formaten heruntergeladen werden, beispielsweise:

  • als alphabetisch permutierte Fassung (PDF),
  • als alphabetischer Index eines bestimmten Mikrothesaurus (XLS),
  • im XML-Format,
  • als thematische Fassung (PDF), unter anderem mit den Bereichen
    • politisches Leben
    • internationale Beziehungen
    • Europäische Union
    • Recht
    • Wirtschafts- und Handelsverkehr
    • Finanzwesen
    • soziale Fragen
    • Bildung und Kommunikation
    • Wissenschaften
    • Unternehmen und Wettbewerb
    • Beschäftigung und Arbeit
    • Verkehr
    • Umwelt
    • Landwirtschaft, Forstwirtschaft und Fischereiwesen
    • Landwirtschaft und Ernährung
    • Produktion, Technologie und Forschung
    • Energie
    • Industrie
    • Geografie
  • als mehrsprachige Liste der sprachlichen Äquivalente für Vorzugsbenennungen (XLS), entweder nach Konzept-Identifikationsnummer oder alphabetisch sortiert.

Für das Herunterladen des EuroVoc-Terminologiebestandes lassen sich beliebige Sprachen kombinieren. Die Excel-Datei („mehrsprachige Liste“) sieht dann beispielsweise so aus (Ausschnitt):

Vor der Einbindung dieses Glossars in das eigene CAT-Tool oder auch vor der Verschmelzung des EuroVoc-Glossars mit einem eigenen Glossar sollte die Übersetzerin eventuell noch einige Zusatzinformationen aufnehmen (z.B. dass es sich um die EuroVoc-Version 4.4 vom 15.12.2012 handelt). Einen kurzen Hinweis dazu enthält mein Blogartikel Mit dem TransTool-Glossarmanager der Eichhörnchen-Falle entgehen.

Weitere Quellen für Glossare: Glossarissimo!

Abschließend noch ein kurzer Hinweis auf weitere Quellen für Glossare: In seinem Blog Glossarissimo! sammelt Stefano KaliFire Links zu ein- und mehrsprachigen (Terminologie-)Ressourcen für Übersetzer*innen und Dolmetscher*innen. Wer auf der Suche nach einem Glossar für ein bestimmtes Fachgebiet ist, sollte in Glossarissimo! suchen (Anleitung hier) – wenngleich natürlich nicht alle dort genannten Glossare von gleicher Qualität sind und erst sorgsam begutachtet werden sollten, bevor sie auf den eigenen Rechner heruntergeladen und dem CATzchen zum Fraß vorgeworfen werden.

Keine Kommentare:

Kommentar veröffentlichen