CorpusReader : construction et interrogation de corpus multiannotés

Sylvain Loiseau
LIMSI (CNRS)
B.P. 133
91403 ORSAY CEDEX
sloiseau@limsi.fr
 
CorpusReader est une plate-forme pour construire et interroger des corpus multiannotés. Ces corpus articulent plusieurs niveaux de description linguistique (morphologie, syntaxe, sémantique, etc.), de façon à permettre la construction d’observables associant plusieurs niveaux, ainsi que la description de corrélations entre niveaux de description. Les corpus multiannotés sont complexes à construire, à représenter et à interroger. Les spécificités de CorpusReader tiennent principalement au choix d’opérer une fusion a posteriori des annotations que produisent les outils d’analyse existants, plutôt qu’à organiser leur interopérabilité.