Extraction probabiliste de chaînes de mots relatives à une opinion

Rémi Lavalley*,**, Chloé Clavel** and Patrice Bellot*
*LIA; Université d’Avignon et des Pays de Vaucluse; Agroparc; BP 91228; 84911 Avignon Cedex 9; France; remi.lavalley, patrice.bellot@univ-avignon.fr
**EDF R&D; 1, avenue du Général de Gaulle; 92141 Clamart; France; chloe.clavel@edf.fr
Résumé
Nous proposons une méthode permettant d’extraire automatiquement des chaînes de mots relatives à des opinions à partir de corpus étiquetés. Il s’agit dans un premier temps d’améliorer les performances de systèmes de catégorisation automatique utilisés pour retrouver l’opinion (positive, négative ou neutre) rattachée à un texte. Dans un deuxième temps, la visualisation de ces chaînes permet d’avoir un aperçu des critiques fréquemment rencontrées. Cette méthode est testée sur des corpus en français ou en anglais de critiques de jeux vidéo et de films et sur un corpus d’enquêtes téléphoniques de satisfaction clients. Nous présentons des exemples de chaînes de mots extraites et les améliorations observées pour la catégorisation.