Variabilité des performances des outils de TAL et genre textuel

Marie-Paule Jacques* and Nathalie Aussenac-Gilles**
*ERSS - UMR 5610; Maison de la Recherche - Université de Toulouse-Le Mirail; 5, allée Antonio-Machado, F-31058 Toulouse Cedex 9; marie-paule.jacques@univ-tlse2.fr
**Institut de Recherche en Informatique de Toulouse (IRIT) – CNRS; UPS, 118, route de Narbonne, F-31062 Toulouse Cedex; aussenac@irit.fr
Résumé
Nous rapportons dans cet article un ensemble de résultats liés à la mise au point d’une base de marqueurs de relations lexicales pour un outil d’aide à la réalisation d’ontologies à partir de textes, CAMÉLÉON. L’évaluation de ces patrons sur huit corpus différents montre une grande variation de leurs performances selon le corpus testé. Cela nous conduit à deux sortes de conclusions : 1. dans le cadre de traitements automatiques, il est nécessaire de fournir à l’utilisateur des informations sur les corpus avec lesquels ces traitements ont été mis au point ; 2. la recherche en matière de TAL doit contribuer à définir une meilleure caractérisation des textes et des genres textuels en relation avec les traitements possibles, au-delà d’une classification unique et rigide des textes.
Paru dans