Banque de Données Langue Corse (BDLC)

Soumis par kevers_l le mer 21/10/2020 - 13:50
La BDLC accueille des données linguistiques en lien avec des savoir-faire et des traditions culturelles corses sur l’ensemble du territoire insulaire. Lors d’enquêtes sur le terrain auprès de locuteurs locaux, ces données sont collectées grâce à des questionnaires thématiques constitués de listes de mots en français. La collecte des traductions correspondantes en corse est permise et un entretien semi-dirigé entièrement en corse et relatif aux pratiques s’engage afin de recueillir aussi des ethnotextes (témoignages). Ces données sont ensuite traitées et analysées –sur le plan linguistique– et mises en ligne sur le site http://bdlc.univ-corse.fr. Elles font également l'objet de publications, tant dans des ouvrages scientifiques (le Nouvel Atlas Linguistique et ethnographique de la Corse - NALC) que dans des collection de semi-vulgarisation (Detti è Usi di paesi). Depuis janvier 2019, le programme BDLC travaille au développement d'outils et de ressources pour mettre en oeuvre le Traitement Automatique du Langage (TAL) appliqué à la langue corse. L'objectif est de créer et de mettre à disposition de la communauté scientifique et du grand public, une boîte à outils pour le TAL corse contenant des ressources et des outils de base (voir https://bdlc.univ-corse.fr/tal/).    
Thématiques principales
Corpus
Lemmatisation
Annotation morphosyntaxique
Traduction
Lieu

20250 Corte
France

Tutelle(s)
UMR CNRS 6240 LISA
Responsable de l'équipe
Stella Retali-Medori
Taille
4
Nombre de permanents
1