Comprendre les effets des erreurs d’annotations des plates-formes de TAL

Davy Weissenbacher* and Adeline Nazarenko**
*COIN Laboratory, Toyota Technological Institute; 2-12-1 Hisakata, Tempaku; Nagoya - 468-8511; JAPAN; davy.weissenbacher@toyota-ti.ac.jp
**LIPN-Université Paris-Nord; 99 av. J-B. Clément; 93430 Villetaneuse; FRANCE; nazarenko@lipn.univ-paris13.fr
Résumé
Les résultats des analyses des outils de TAL sont souvent des annotations qui caractérisent les séquences des textes analysés. Ces annotations sont dites erronées lorsque leurs valeurs diffèrent des valeurs attribuées par un expert. Des architectures innovantes sont aujourd’hui proposées pour annoter et corriger simultanément des annotations de différentes catégories. Mais la complexité des calculs requis limite le nombre d’annotations réellement intégrées. Nous étudions ici une alternative conservant l’architecture standard de traitement en cascade. Nous montrons, sur la résolution des anaphores, que la modélisation de l’incertitude des annotations permet de limiter l’impact des annotations erronées, d’intégrer toutes les annotations nécessaires à l’inférence et de différer la révision des erreurs à un post-traitement.
Paru dans