CorpusReader : construction et interrogation de corpus multiannotés

Sylvain Loiseau*
*LIMSI (CNRS); B.P. 133; 91403 ORSAY CEDEX; sloiseau@limsi.fr
Résumé
CorpusReader est une plate-forme pour construire et interroger des corpus multiannotés. Ces corpus articulent plusieurs niveaux de description linguistique (morphologie, syntaxe, sémantique, etc.), de façon à permettre la construction d’observables associant plusieurs niveaux, ainsi que la description de corrélations entre niveaux de description. Les corpus multiannotés sont complexes à construire, à représenter et à interroger. Les spécificités de CorpusReader tiennent principalement au choix d’opérer une fusion a posteriori des annotations que produisent les outils d’analyse existants, plutôt qu’à organiser leur interopérabilité.
Document
Rank
7