Skip to main content
Terminologie 2

Prinzipien der Datenkategorien (9/10)

Für eine gut strukturierte Termbank müssen einige Prinzipien bezüglich der Datenkategorien befolgt werden. Das sind: ElementaritätGranularität und Interdependenz.

Elementarität

Dem ersten Prinzip zufolge, der Elementarität von Datenkategorien, sollte ein Datenelement einer Datenkategorie zugeordnet werden. Eine strukturierte Terminologiedatenbank hat eine Vielzahl von Datenkategorien, aber es ist grundlegend, dass jede Datenkategorie nur eine Information enthält. Elementaritätist ein grundlegendes Prinzip, um die Funktionalität von Termbanken zu steigern und Probleme beim Austausch von Terminologie zu vermeiden (z.B. kann es keinen klaren Eintrag geben, wenn innerhalb eines Datenkategorieeintrags ein Kontextbeispiel und eine Definition zusammengefasst werden). 

Z.B. sind im folgenden Termbankeintrag zwei Benennungen eingetragen: Hinweisund Hinweistext im Feld Deutsch:

DeutschHinweis (e) / Hinweistext

Englischnote(s)

QuelleSAGA

Hinweis und Hinweistext sollten als Synonyme angesehen und in zwei separate Felder eingetragen werden. Die Pluralformen in den Feldern Deutsch und Englisch sind unnötig. Bei unregelmäßiger Pluralbildung sollte dies in einem Kontextbeispiel beschrieben werden oder z.B. in einem Feld Anmerkung.

Granularität

Das zweite Prinzip, die Granularität von Datenkategorien, bezieht sich darauf, dass Datenkategorien so präzise wie möglich definiert werden sollen. 

Im folgenden Beispiel eines Termbankeintrags herrscht keine Granularität (siehe das Feld Grammatik, das sich auf das Genus der Benennung bezieht):

DeutschGewinnabführungsverträge

Grammatikm, pl

Für verschiedene Arten von grammatischen Informationen sollten eigene Felder definiert werden, sonst ist z.B. das auf diese Kategorien gestützte Filtern nicht möglich:

DeutschGewinnabführungsverträge

Genusm

NumerusPl.

Die ISO 12620 (1998) bietet eine Reihe von Datenkategorien, die anderen Datenkategorien übergeordnet sind. Trotzdem sollte man nicht vergessen, dass Granularität von der jeweiligen Sprache abhängig ist. So ist die Kategorie Deklination z.B. relevant für englische Nomen und deren Plural, aber für deutsche Nomen müssen noch Unterkategorien für den jeweiligen Kasus gebildet werden - NominativAkkusativGenitiv und Dativ (vgl. Trippel, 1999).

Interdependenz

Das letzte Prinzip befasst sich mit der Interdependenz von Datenkategorien. Abhängigkeitsverhältnisse zwischen Datenkategorien erfolgen aus ihrem Inhalt. Zum Beispiel:

  • Eine Definition benötigt immer die Angabe einer Quelle. Diese kann natürlich neben Literatur auch eine Website oder Person sein (z.B. ein Ingenieur oder ein Muttersprachler etc.).
  • Für eine zweite Definition muss das Feld Quelle erneut erstellt werden.
  • Die Quelle der Definition muss von der Quelle der Benennung oder des Kontexts unterschieden werden, entweder durch den Gebrauch einer eigenen Datenkategorie (z.B. Def_Quelle) oder durch das Festlegen hierarchischer Beziehungen in der Eintragsstruktur.

Diese gegenseitigen Abhängigkeiten müssen beim Gestalten und Definieren der Eintragsstruktur, beim Modellieren der Datenkategorien und beim Eintragen der Daten berücksichtigt werden.

Weiter