Conversion et améliorations de corpus du français annotés en Universal Dependencies

Bruno Guillaume*, Marie-Catherine de Marneffe** and Guy Perrier*
*Université de Lorraine, CNRS, Inria, LORIA, F-54000 Nancy, France
**The Ohio State University, Columbus, Ohio, USA
Résumé
Cet article décrit l’effort d’amélioration de deux corpus du français annotés en dépendances
syntaxiques, qui s’inscrit dans le cadre du projet Universal Dependencies (UD) qui
vise à élaborer un schéma d’annotation syntaxique permettant d’analyser de façon similaire
plusieurs langues différentes. Nous avons cherché à rendre plus conformes au schéma UD ces
deux corpus du français, et nous avons évalué l’impact des modifications apportées aux corpus
sur la conformité avec le schéma UD et la cohérence interne de leur annotation.
Résumé (en anglais)
This paper describes an effort to improve the consistency of two French corpora annotated
with the Universal Dependencies (UD) scheme. The Universal Dependencies project
aims at building a syntactic dependency scheme which allows similar analyses for several different
languages. We improved the annotations of the two French corpora to render them closer
to the UD scheme, and evaluated the changes done to the corpora in terms of closeness to the
UD scheme as well as of internal corpus consistency.
Paru dans