Terminologieextraktion (6/6)
Terminologieextraktion (TE) stellt einerseits die Ermittlung von potenziellen Benennungen (TC für "Term Candidate") innerhalb eines bestimmten Textes oder einer Sammlung von Texten (Korpus) dar und andererseits die Bestimmung von relevanten Informationen, die sich auf einen Begriff oder auf den Gebrauch einer Benennung beziehen - wie z.B. Definition, Kontext etc. Die TE kann automatisch ausgeführt werden, indem man Terminologieextraktionstools (TETs) benutzt.
TE sollte nicht mit Terminologie-Bestimmung verwechselt werden. Letzteres bezieht sich auf das Erkennen neuer oder vorhandener Benennungen, indem Listen mit potenziellen Benennungen (das Ergebnis von TETs) mit einer vorhandenen Terminologiedatenbank verglichen werden, um bekannte von unbekannten Benennungen zu unterscheiden.
TE ist ein schnelle Art, sich Wissen über ein Fachgebiet und die dazugehörige Fachsprache anzueignen. Trotzdem müssen nach dem Extrahieren von potenziellen Benennungen durch Tools immer noch menschliche Fachkräfte entscheiden, ob die Ergebnisse korrekt sind. Das regelmäßige Ausführen von Terminologieextraktion kann auch eine Strategie darstellen, um auf dem aktuellen Wissensstand in einem bestimmten Fachgebiet zu bleiben (The Pavel Terminology Tutorial, 2006).
TE wird als fester Bestandteil der Terminologearbeit angesehen und stellt eine wichtige Tätigkeit beim Erstellen von Terminologiedatenbanken dar. Sie erlaubt eine schnelle Ermittlung von möglichen Benennungen, die für eine weitere Untersuchung, Bewertung und Aufnahme in eine Datenbank durch einen Experten des jeweiligen Fachgebiets festgehalten werden können. Ein weiterer Vorteil der TE mit TETs beim Erstellen von Termbanken besteht darin, dass die Ergebnisse in verschiedenen Formaten gespeichert werden können, die dann wiederum später leicht in andere Datenbanken importiert werden.