Accueil du site Accueil du site Adhésion Contact Plan du site

LGeRM

Lemmatisation des mots en moyen français


Gilles Souvay, Jean-Marie Pierrel

ATILF/CNRS & Nancy-Université
44, avenue de la Libération
B.P. 30687
F 54063 NANCY CEDEX
gilles.souvay@atilf.fr
jean-marie.pierrel@atilf.fr

Contrairement à la plupart des langues modernes, le moyen français est une langue dont l’orthographe n’est pas encore stabilisée. Il existe de très nombreuses variantes pour un même mot et en conséquence les méthodes classiques de lemmatisation ne peuvent pas s’appliquer. LGeRM (lemmes, graphies et règles morphologiques) propose une solution qui s’appuie sur une base de formes connues lemmatisées et sur un ensemble de règles graphémiques et morphologiques spécifiques de la langue médiévale. Il permet ainsi de faciliter la consultation d’un dictionnaire, l’interrogation et la lemmatisation de textes médiévaux et trouve des applications dans l’édition électronique de manuscrits et la construction automatique de glossaires. Cet outil polyvalent est accessible sur Internet à l’adresse www.atilf.fr/dmf.


Télécharger:
Fichier PDF
Gilles Souvay, Jean-Marie Pierrel
286.3 ko

TAL Volume 50 2009 . 2. Traitement automatique des langues et langues anciennes

Date de dernière mise à jour : 8 janvier 2010, auteur : Rédacteurs en chef.