Accueil du site Accueil du site Adhésion Contact Plan du site

Variabilité des performances des outils de TAL et genre textuel

Cas des patrons lexico-syntaxiques


Marie-Paule Jacques* - Nathalie Aussenac-Gilles**

* ERSS - UMR 5610
Maison de la Recherche - Université de Toulouse-Le Mirail
5, allée Antonio-Machado, F-31058 Toulouse Cedex 9
marie-paule.jacques@univ-tlse2.fr

** Institut de Recherche en Informatique de Toulouse (IRIT) - CNRS
UPS, 118, route de Narbonne, F-31062 Toulouse Cedex
aussenac@irit.fr


Nous rapportons dans cet article un ensemble de résultats liés à la mise au point d’une base de marqueurs de relations lexicales pour un outil d’aide à la réalisation d’ontologies à partir de textes, CAMÉLÉON. L’évaluation de ces patrons sur huit corpus différents montre une grande variation de leurs performances selon le corpus testé. Cela nous conduit à deux sortes de conclusions : 1. dans le cadre de traitements automatiques, il est nécessaire de fournir à l’utilisateur des informations sur les corpus avec lesquels ces traitements ont été mis au point ; 2. la recherche en matière de TAL doit contribuer à définir une meilleure caractérisation des textes et des genres textuels en relation avec les traitements possibles, au-delà d’une classification unique et rigide des textes.



Télécharger:
Fichier PDF
Marie-Paule Jacques - Nathalie Aussenac-Gilles
452.9 ko
Annexe (patrons) texte - Pièce jointe sous la seule responsabilité de l’auteur
Marie-Paule Jacques - Nathalie Aussenac-Gilles
11.4 ko


Date de dernière mise à jour : 15 novembre 2010, auteur : Rédacteurs en chef.