Nemesis, un système de reconnaissance incrémentielle des entités nommées pour le français

Auteurs
Fourour, Nordine
Résumé
Cet article présente une étude des conflits engendrés par la reconnaissance des entités nommées (EN) pour le français, ainsi que quelques indices pour les résoudre. Cette reconnaissance est réalisée par le système Nemesis, dont les spécifications ont été élaborées conséquemment à une étude en corpus. Nemesis se base sur des règles de grammaire, exploite des lexiques spécialisés et comporte un module d’apprentissage. Les performances atteintes par Nemesis, sur les anthroponymes et les toponymes, sont de 90% pour le rappel et 95% pour la précision.
Mots-clés
entité nommée
lexique
lexique spécialisé
surcomposition référentielle
reconnaissance incrémentielle
Document