Extraction probabiliste de chaînes de mots relatives à une opinion

Rémi Lavalley* **, Chloé Clavel**, Patrice Bellot*
 
Nous proposons une méthode permettant d’extraire automatiquement des chaînes de mots relatives à des opinions à partir de corpus étiquetés. Il s’agit dans un premier temps d’améliorer les performances de systèmes de catégorisation automatique utilisés pour retrouver l’opinion (positive, négative ou neutre) rattachée à un texte. Dans un deuxième temps, la visualisation de ces chaînes permet d’avoir un aperçu des critiques fréquemment rencontrées. Cette méthode est testée sur des corpus en français ou en anglais de critiques de jeux vidéo et de films et sur un corpus d’enquêtes téléphoniques de satisfaction clients. Nous présentons des exemples de chaînes de mots extraites et les améliorations observées pour la catégorisation.

 

* LIA
Université d’Avignon et des Pays de Vaucluse
Agroparc
BP 91228
84911 Avignon Cedex 9
France
remi.lavalley, patrice.bellot@univ-avignon.fr

** EDF R&D
1, avenue du Général de Gaulle
92141 Clamart
France
chloe.clavel@edf.fr