Enrichissement de lexiques sémantiques approvisionnés par les foules : le système WISIGOTH appliqué à Wiktionary

Franck Sajous*, Emmanuel Navarro** et Bruno Gaume*
*CLLE-ERSS;5 allées Antonio Machado;F-31058 Toulouse Cedex 9; [sajous,gaume]@univ-tlse2.fr
**IRIT;118 route de Narbonne;F-31500 Toulouse; navarro@irit.fr
Résumé
Bien que de nombreuses applications de TAL reposent sur des ressources lexicales sémantiques, celles-ci sont rarement simultanément de qualité satisfaisante et librement disponibles. Partant de la confrontation entre méthodes traditionnelles et tendances émergentes de construction et d’évaluation de ressources lexicales, nous présentons dans cet article une nouvelle méthode fondée sur Wiktionary, un dictionnaire multilingue libre, disponible en ligne et construit collaborativement, puis nous proposons un enrichissement semi-automatique de son réseau de synonymie utilisant des données endogènes et exogènes, recourant à une validation « par les foules ». Nous décrivons enfin une implémentation de ce système baptisée WISIGOTH.
Paru dans
Document
Rank
1