Une étude comparative de méthodes de catégorisation sémantique de termes techniques

Auteurs
Cerbah, Farid
Résumé
L’acquisition et la mise à jour de ressources terminologiques sont des tâches difficiles, en particulier lorsque ces ressources contiennent des informations d’ordre sémantique. Cette article traite de la catégorisation sémantique de termes techniques. Le but de ce processus est d’assigner des domaines sémantiques à de nouveaux termes. Nous proposons deux approches qui reposent sur des sources d’informations différentes. L’approche exogène exploite des informations contextuelles extraites de corpus. L’approche endogène repose sur une analyse lexicale de termes déjà catégorisés. Nous décrivons les deux approches mises en oeuvre ainsi que les expérimentations menées sur des jeux de test significatifs. Les résultats obtenus montrent que la catégorisation de termes peut constituer une aide conséquente dans les processus d’acquisition de ressources terminologiques.
Mots-clés
acquisition de termes techniques
terminologie
analyse lexicale
corpus