Corpus de la parole : collecte, catalogage, conservation et diffusion des ressources orales sur le français et les langues de France

Michel Jacobson* and Oliver Baude**,***
*Service interministériel des archives de France; 56, rue des Francs-Bourgeois 75003 Paris; michel.jacobson@culture.gouv.fr
**Laboratoire Ligérien de Linguistique; Université d’Orléans; olivier.baude@univ-orleans.fr
***Délégation générale à la langue française et aux langues de France
Résumé
Le programme « Corpus de la parole » est un projet en collaboration entre le ministère de la Culture et de la Communication et le CNRS qui vise à constituer une collection de ressources orales sur le français et les langues de France. Un portail Web offre un accès éditorialisé à cette collection. Cet article présentera les points principaux de l’organisation de ce programme, de la collecte des corpus aux aspects de pérennisation en passant par l’accès et la diffusion des données numériques.