Le CID - Corpus of Interactional Data

R. Bertrand*, P. Blache*, R. Espesser*, G. Ferré**, C. Meunier*, B. Priego-Valverde* and S. Rauzy*
*Aix-Marseille Universités - Laboratoire Parole et Langage; CNRS/Université de Provence; 29, avenue Robert-Schuman - 13621 Aix-en-Provence - Cedex 1; roxane.bertrand ; philippe.blache ; robert.espesser ; christine.meunier ; beatrice.priego-valverde ; stephane.rauzy@lpl-aix.fr
**Centre International des Langues, département d’études anglaises; Université de Nantes; Chemin de la Censive du Tertre - 44312 Nantes - Cedex 3; gaelle.ferre@univ-nantes.fr
Résumé
La compréhension des mécanismes du langage nécessite de prendre en compte très précisément les interactions entre les différents domaines ou modalités linguistiques, ce qui implique la constitution et le développement de ressources. Nous décrivons ici le CID (Corpus of Interactional Data), corpus audio-vidéo de 8 heures, en français, constitué au Laboratoire Parole et Langage (LPL). L’annotation multimodale du CID inclut la phonétique, la prosodie, la morphologie, la syntaxe, le discours et la mimogestualité. Les premiers résultats de nos études sur le CID permettent de confirmer l’intérêt d’une annotation multimodale pour mieux comprendre le fonctionnement du discours.