Fouille d'opinions et analyse de sentiments

L’étude des opinions, sentiments, émotions ou jugements d’évaluation à partir de données écrites ou orale se généralise de plus en plus alors que les connaissances sur ces sujets ne sont encore que très parcellaires.

En effet, la caractérisation et la modélisation de l’information subjective (opinions, sentiments, émotions, jugements d’évaluation, etc.) constituent un problème scientifique difficile à traiter. Les phénomènes subjectifs recouvrent des concepts riches, divers et dont les frontières sont difficiles à établir. Certains modèles se limitent à une classification en polarité (positif, neutre, négatif), d’autres proposent une modélisation plus fine en intégrant des arguments tels que la source (la personne qui exprime l’opinion, le sentiment ou l’émotion), la cible (l’objet de l’expression d’opinion) et l’expression de l’opinion/sentiment/émotion/jugement d’évaluation. Cependant, la modélisation du discours subjectif reste partielle, en effet, une analyse complète nécessite l’intégration d’autres informations indispensables telles que la classe sémantique (colère, peur, joie, plaisir, surprise, etc.) ou encore le degré d’engagement de la source.

Différents modes de représentation utilisés dans la littérature pour modéliser les classes sémantiques subjectives, qui décrivent les émotions, les sentiments et les opinions. Or, la définition même de ces trois concepts pose encore problème et des recouvrements dans la représentation de ces derniers existent. À l’heure actuelle, les théories les plus mises en œuvre sont celles modélisant les états affectifs grâce à une série d’étiquettes. Il faut noter que des études utilisant des dimensions continues au lieu d’étiquettes commencent à voir le jour. D’une manière générale chaque modélisation comporte des avantages : les modèles à base d’étiquettes permettent une compréhension aisée des classes à utiliser mais peuvent se heurter à des problèmes d’interprétation sémantique de la part des sujets qui auront à les utiliser. Les modèles à base de dimensions continues proposent quant à eux de décomposer un état affectif en un certain nombre de dimensions mais peuvent souffrir d’une difficulté de mise en œuvre supérieure à celle des modèles à base d’étiquettes.

Concernant les méthodes utilisées pour la capture et la détection des états affectifs, qu’elles soient statistiques ou symboliques, elles nécessitent des ressources linguistiques dont le processus de construction reste long, coûteux et difficile à mettre en place pour certaines langues peu dotées. De plus, ces méthodes peuvent atteindre facilement leurs limites et se heurter à des problèmes d’ambiguïté d’interprétation. En effet, en plus de leur définition linguistique et sémantique, les états affectifs, demandent à être décrits également de façon formelle en identifiant par exemple les différents prédicats qui les définissent et les distinguent entre eux. Des travaux récents proposent des modèles basés sur une formalisation logique des états affectifs. Les modèles proposés consistent, généralement à identifier et associer à chaque état affectif un ensemble de conditions et de prédicats uniques. Toutefois, il est souvent difficile d’associer les réalisations linguistiques aux prédicats affectifs, ce qui rend l’application de ces modèles assez ardue.

Enfin, la complexité du langage subjectif pose d’autres problématiques scientifiques quant à son analyse comme par exemple la prise en compte de la négation ou la détection de métaphores et de l’ironie.

L’ambition de cette journée est de faire le point sur les études récentes qui portent sur la modélisation du discours subjectif ainsi que sur les travaux portant sur la capture et l’identification de la subjectivité quel que soit leur niveau de granularité et le domaine d’application concerné. Cette journée se veut aussi un cadre pour poursuivre les échanges entre représentants de plusieurs branches du TAL et des sciences du langage, sur les méthodologies et les modes d’approche adaptés à l’analyse du discours subjectif, compte tenu des dernières avancées en linguistique de corpus et en informatique.

Différentes problématiques sont envisageables :

  • la modélisation linguistique et informatique de la subjectivité dans la langue (orale et écrite et signée)
  • l’expression de la subjectivité en langue et en discours, à l’écrit ou à l’oral
  • la construction, l’acquisition et la validation de ressources linguistiques (dictionnaires, lexiques, ontologies, corpus, etc.) pour l’analyse de la subjectivité.
  • les méthodes et les outils pour identifier, annoter et extraire des opinions, sentiments et émotions portées ou mentionnées par le langage dans des documents textuels ou audiovisuels.
  • la présentation synthétique de la diversité des contenus subjectifs.

TYPES DE COMMUNICATION

Les auteurs peuvent présenter leurs travaux sous forme d’une communication orale ou d’une démonstration informatique.

MODALITÉS DE SOUMISSION

Les propositions de communications devront se présenter sous la forme d’un résumé d’une page. Elle comportera les indications suivantes :

  • titre de la communication
  • auteur(s) et affiliation(s)
  • 4 ou 5 mots-clés
  • exposé de la problématique de l’étude donnant les détails pertinents (type de corpus, méthodologie, résultats, écueils et difficultés ...)
  • principales références bibliographiques
  • type de communication souhaité : présentation orale, démonstration

Les propositions de communication devront être envoyées avant le 15 février 2015 à l’adresse suivante : amel.fraisse@limsi.fr

DATES IMPORTANTES

  • soumission des résumés : 15 février 2015
  • notification d’acceptation : 8 mars 2015
  • journée d’étude : 21 mars 2015

COMITÉ SCIENTIFIQUE

  • Thierry Poibeau (LaTTiCe)
  • Julien Velcin (ERIC)
  • Patrick Paroubek (LIMSI-CNRS)
  • Béatrice Daille (LINA)
  • Mathieu Valette (INaLCO)
  • Amel Fraisse (LIMSI-CNRS)
  • Agata Jackiewicz (Paris 4, STIH)
  • Marc El-bèze (LIA)
  • Stéphane Ferrari (GREYC)
  • Vincent Guigue (LIP6)
  • Michel Généreux (EURAC Research)

COMITÉ D’ORGANISATION

  • Amel Fraisse (LIMSI-CNRS)

Voir : http://www.amel-fraisse.fr/actualites/journe-detude-atala

Date
21 March 2015
Lieu

INALCO
Paris
France

E-mail de contact
amel.fraisse@limsi.fr
Organisation
Amel Fraisse (LIMSI-CNRS)