L'extraction de terminologie (ET) consiste à identifier des termes potentiels (TP) dans un texte spécifique ou un ensemble de textes (corpus) ainsi que les informations pertinentes liées à l'emploi de ces termes ou aux concepts auxquels ils renvoient (définition, contexte, etc.). L'extraction de terminologie s'accomplit automatiquement grâce à l'utilisation d'outils d'extraction terminologique (OET).
Il ne faut pas confondre l'ET et l'identification de terminologie qui renvoie à l'identification de termes nouveaux ou déjà existants grâce à la comparaison entre la liste des termes potentiels et une base de données terminologique existante afin de distinguer les termes connus des termes inconnus.
L'ET est un moyen rapide d'acquérir des connaissances sur un domaine et le langage spécialisé qui s'y rattache. Cependant, après l'extraction de termes potentiels par les logiciels, des spécialistes doivent décider si les résultats obtenus sont adaptés ou non. Effectuer une ET régulière peut être un moyen de se maintenir informé du développement récent de la terminologie dans un domaine particulier (The Pavel Terminology Tutorial, 2006).
L'ET est une part intégrante du travail terminologique et représente une étape importante lors de la création de bases de données terminologiques. Elle permet une identification rapide de termes susceptibles d'intéresser un spécialiste des langues. Elle permet également une intégration de termes dans une base de données.
Le résultat d'une ET automatique réalisée à l'aide d'OET peut être enregistré dans différents formats et donc facilement importé ultérieurement vers d'autres bases de données. C'est là un autre avantage de l'ET à l'aide d'OET.