Nouvelle approche de la sélection de vocabulaire pour la détection de thème

Auteurs
Brun, Armelle
Smaïli, Kamel
Haton, Jean-Paul
Résumé
En reconnaissance de la parole, un des moyens d’améliorer les performances des systèmes est de passer par l’adaptation des modèles de langage. Une étape cruciale de ce processus consiste à détecter le thème du document traité et à adapter ensuite le modèle de langage. Dans cet article, nous proposons une nouvelle approche de création des vocabulaires utilisés pour la détection de thème. Cette dernière est fondée sur le développement de vocabulaires spécifiques et caractéristiques des différents thèmes. Nous montrons que cette approche permet non seulement d’améliorer les performances des méthodes, mais exploite également des vocabulaires de taille réduite. De plus, elle permet d’améliorer de façon très significative les performances de méthodes de détection lorsqu’elles sont combinées.
Mots-clés
information
information mutuelle
détection de thème
sélection de vocabulaire
corpus
corpus d’apprentissage
Document