Terminologie 2

Principes des catégories de données (9/10)

Afin d'avoir une base terminologique bien structurée il existe certains principes concernant les catégories de données à respecter. Il s'agit de : l'élémentarité, la granularité et l'interdépendance.

Elémentarité

Conformément au premier principe, l'élémentarité des catégories de données, un élément de données doit renvoyer à une catégorie de données. Une base de données terminologiques structurée contient un nombre X de catégories de données, mais il est fondamental que chaque catégorie de données ne contiennent qu'une information. L'élémentarité est un principe de base qui aide à augmenter la fonctionnalité des bases terminologiques et à éviter les problèmes lors de l'échange de terminologies (par exemple, les fiches ne seront pas claires si un exemple de contexte renvoie à une définition dans une fiche de catégorie de données).

Par exemple, pour l'entrée de base terminologique suivante, les deux termes Hinweis et Hinweistext sont dans le champ Allemand :

Allemand : Hinweis (e) / Hinweistext

Anglais : note(s)

Source : SAGA

Hinweis et Hinweistext devraient tous deux être considérés comme des synonymes et être enregistrés dans deux champs disctincts. Mettre les formes du pluriel dans les champs Allemand et Anglais n'est pas nécessaire. Si le pluriel est irrégulier, il devrait être illustré par un exemple de contexte ou par exemple dans un champ intitulé Remarque.

Granularité

Le deuxième principe, la granularité de catégories de données, fait référence au fait que les categories de données doivent être les plus précises possibles.

Dans l'exemple de la fiche d'une base de données terminologiques suivant il n'y a pas de granularité (cf. le champ Grammaire qui renvoie au genre du terme) :

Allemand : Gewinnabführungsverträge

Grammaire : m, pl

Des informations grammaticales différentes devraient être réparties dans des champs d'information distincts. Dans le cas contraire, un filtrage sur la base de ces catégories n'est pas possible :

Allemand : Gewinnabführungsverträge

Genre : m

Nombre : pl

ISO 12620 (1998) offre une série d'arborescence de catégories de données. Cependant, il faut garder à l'esprit que la granularité diffère d'une langue à l'autre. La catégorie Inflection par exemple est suffisante pour les mots anglais et leur pluriel, en revanche, pour les noms allemands des subdivisions en fonction des différents cas est nécessaire : nominatif, accusatif, génitif (ou cas posséssif) et datif (cf. Trippel, 1999).

Interdépendance

Le dernier principe concerne l'interdépendance de catégories de données. La relation de dépendance entre les catégories de données est formée à partir de leurs contenus. Par exemple :

Une Définition exige toujours une source, qui peut bien évidemment renvoyer à autre chose qu'à un dictionnaire, à une page Web ou une personne par exemple (un spécialiste, un locuteur natif...).
S'il y a deux définitions, il doit y avoir également deux sources.
Il est nécessaire de distinguer la source de la définition de la source du mot ou du contexte soit en utilisant une catégorie de données spécifique (par exemple Def_Source) soit en définissant une relation hiérarchique dans la structure de la fiche

Ces relations d'interdépendance sont à prendre en considération au moment de la création et de la définition de la structure de la fiche, de l'attribution de catégories de données, de l'entrée de données.

Principes des catégories de données (9/10)

Elémentarité

Granularité

Interdépendance

Cours

Directives

Nous contacter