Modèles de langage à portée variable : Application au traitement des homophones

Auteurs
Béchet, Frédéric
Nasr, Alexis
Spriet, Thierry
de Mori, Renato
Résumé
L’objectif de cette étude concerne le traitement d’homophones singulier/pluriel dans un Système de Reconnaissance de la Parole en exploitant les contraintes d’accord dans la phrase à reconnaître. Un certain nombre de ces contraintes ne peut être traité par les modèles de langage à portée locale de type n-gram utilisés habituellement. Les deux modèles proposés, le modèle à base de syntagme et le modèle Homophone-Cache, permettent de résoudre certains cas d’homophonie par deux méthodes différentes : le modèle à base de syntagme permet d’introduire des contraintes syntaxiques ; le modèle Homophone-Cache a pour objet de discriminer les homophones singulier/pluriel, de manière robuste, en étant peu sensible à la mauvaise reconnaissance d’un mot au sein de la phrase.
Mots-clés
groupe nominal
homophone
modèle de langage
corpus
corpus d’apprentissage
système de reconnaissance
Document