Apprentissage non supervisé de familles morphologiques : comparaison de méthodes et aspects multilingues

Delphine Bernhard*
*Laboratoire d’Informatique pour la Mécanique et les Sciences de l’Ingénieur; LIMSI-CNRS; B.P. 133 F-91403; Orsay CEDEX; delphine.bernhard@limsi.fr
Résumé
Cet article décrit MorphoClust et MorphoNet, deux méthodes pour l’apprentissage non supervisé de familles morphologiques. MorphoClust forme des familles par groupements successifs, de manière similaire aux méthodes de classification ascendante hiérarchique. La méthode MorphoNet est quant à elle fondée sur la détection de communautés dans des réseaux lexicaux. Les nœuds de ces réseaux représentent des mots et les liens des règles de transformation morphologique acquises automatiquement à partir de mots graphiquement similaires. Nous appliquons ces deux méthodes à un lexique bilingue anglais-allemand, de manière isolée et sous forme combinée, et évaluons les résultats obtenus en utilisant la base de données lexicales CELEX.
Document
Rank
1