Damien Poirier*,**, Françoise Fessant* and Isabelle Tellier**
*Orange Labs; 2 avenue Pierre Marzin; 22300 Lannion; FRANCE; prénom.nom@orange-ftgroup.com
**Laboratoire d’Informatique Fondamentale d’Orléans; Rue Léonard de Vinci; 45000 Orléans; FRANCE; prénom.nom@univ-orleans.fr
Résumé
Cet article s’intéresse à la classification d’opinions de textes communautaires par apprentissage supervisé, en vue de les utiliser pour un système de recommandation. Nous comparons différents prétraitements, représentations et techniques d’apprentissage sur des données réelles parlant de films et présentant diverses particularités (textes très courts en anglais, contenant beaucoup de codes type sms, d’abréviations, de fautes d’orthographe, etc.). Nous étudions en détails les résultats de différents classifieurs ainsi que l’apport des prétraitements sur ce type de données. Pour finir, nous évaluons les résultats du meilleur classifieur à l’aide d’un moteur de recommandation de type filtrage collaboratif.
Document
Rank
1