Similitude entre les sens d’usage d’un terme dans un réseau lexical

Mathieu Lafourcade* et Alain Joubert*
*LIRMM - Université Montpellier 2 - CNRS; Laboratoire d’Informatique, de Robotique et de Microélectronique de Montpellier; 161, rue Ada, F-34392 Montpellier cedex 5; lafourcade, joubert@lirmm.fr
Résumé
Les relations lexicales typées entre termes sont indispensables pour les tâches réalisées en TALN, mais leur collecte peut s’avérer difficile. En effet, effectuée manuellement, cette tâche nécessite la compétence d’experts et la durée nécessaire peut être prohibitive, alors que, réalisée automatiquement, les résultats peuvent être biaisés par les corpus de textes retenus. L’approche présentée ici consiste à faire participer un grand nombre de personnes à un projet contributif en leur proposant une application ludique accessible sur le Web. À partir d’une base de termes préexistante, ce sont ainsi les joueurs qui vont construire le réseau lexical, en fournissant des associations qui ne sont validées que si elles sont proposées par au moins une paire d’utilisateurs. De plus, ces relations typées sont pondérées en fonction du nombre de paires d’utilisateurs qui les ont proposées. Nous abordons ensuite la question de la détermination des différents sens d’usage d’un terme, en analysant les relations entre ce terme et ses voisins immédiats dans le réseau lexical, avant d’introduire la notion de similitude entre ces différents sens d’usage. Nous pouvons ainsi construire pour un terme son arbre des usages. Enfin, nous présentons brièvement la réalisation et les premiers résultats obtenus.
Paru dans
Document
Rank
7