Variabilité des performances des outils de TAL et genre textuel
Cas des patrons lexico-syntaxiques
Marie-Paule Jacques* - Nathalie Aussenac-Gilles**
* ERSS - UMR 5610
Maison de la Recherche - Université de Toulouse-Le Mirail
5, allée Antonio-Machado, F-31058 Toulouse Cedex 9
marie-paule.jacques@univ-tlse2.fr
** Institut de Recherche en Informatique de Toulouse (IRIT) - CNRS
UPS, 118, route de Narbonne, F-31062 Toulouse Cedex
aussenac@irit.fr
Nous rapportons dans cet article un ensemble de résultats liés à la mise au point
d’une base de marqueurs de relations lexicales pour un outil d’aide à la réalisation
d’ontologies à partir de textes, CAMÉLÉON. L’évaluation de ces patrons sur huit corpus
différents montre une grande variation de leurs performances selon le corpus testé. Cela nous
conduit à deux sortes de conclusions : 1. dans le cadre de traitements automatiques, il est
nécessaire de fournir à l’utilisateur des informations sur les corpus avec lesquels ces
traitements ont été mis au point ; 2. la recherche en matière de TAL doit contribuer à définir
une meilleure caractérisation des textes et des genres textuels en relation avec les traitements
possibles, au-delà d’une classification unique et rigide des textes.
|
Télécharger:
|
Fichier
PDF
Marie-Paule Jacques - Nathalie Aussenac-Gilles
452.9 ko
|
|
Annexe (patrons)
texte
- Pièce jointe sous la seule responsabilité de l’auteur
Marie-Paule Jacques - Nathalie Aussenac-Gilles
11.4 ko
|
|