Jade Mekki*, Nicolas Béchet**, Delphine Battistelli*** and Gwénolé Lecorvé*,****
*Univ Rennes, CNRS, IRISA, Lannion-Vannes, France
**Univ Bretagne Sud, CNRS, IRISA, Vannes, France
***Univ Paris Nanterre, CNRS, MoDyCo, Nanterre, France
****Orange Research, Lannion, France
Résumé
Cet article présente notre méthodologie pour caractériser automatiquement les registres de langue en français. Nous décrivons la méthode des motifs séquentiels émergents utilisée à cette fin et montrons les résultats obtenus sur un corpus de tweets ainsi que, de manière plus générale, sur les registres en français. À la fois prémisse et résultat de notre approche, notre définition de la notion de registre de langue met l’accent sur celle de norme linguistique.
Résumé (en anglais)
This article presents a methodological approach to automatically characterize language registers in French. The method of emerging sequential patterns is described and the
obtained results demonstrated first on a corpus of tweets, then more broadly on registers in French. As both a premise and a result of the present approach, the definition presented in this paper for the notion of a language register highlights the notion of a linguistic norm.
obtained results demonstrated first on a corpus of tweets, then more broadly on registers in French. As both a premise and a result of the present approach, the definition presented in this paper for the notion of a language register highlights the notion of a linguistic norm.
Paru dans
Document
Rank
1