Variabilité des performances des outils de TAL et genre textuel

Cas des patrons lexico-syntaxiques

Marie-Paule Jacques* - Nathalie Aussenac-Gilles**

* ERSS - UMR 5610
Maison de la Recherche - Université de Toulouse-Le Mirail
5, allée Antonio-Machado, F-31058 Toulouse Cedex 9
marie-paule.jacques@univ-tlse2.fr

** Institut de Recherche en Informatique de Toulouse (IRIT) - CNRS
UPS, 118, route de Narbonne, F-31062 Toulouse Cedex
aussenac@irit.fr

Nous rapportons dans cet article un ensemble de résultats liés à la mise au point d’une base de marqueurs de relations lexicales pour un outil d’aide à la réalisation d’ontologies à partir de textes, CAMÉLÉON. L’évaluation de ces patrons sur huit corpus différents montre une grande variation de leurs performances selon le corpus testé. Cela nous conduit à deux sortes de conclusions : 1. dans le cadre de traitements automatiques, il est nécessaire de fournir à l’utilisateur des informations sur les corpus avec lesquels ces traitements ont été mis au point ; 2. la recherche en matière de TAL doit contribuer à définir une meilleure caractérisation des textes et des genres textuels en relation avec les traitements possibles, au-delà d’une classification unique et rigide des textes.