Validation d’une méthodologie pour l’étude des marqueurs de la segmentation dans un grand corpus de textes

Sophie Piérard, Yves Bestgen
Université catholique de Louvain
Place Cardinal Mercier, 10
B-1348 Louvain-la-Neuve
sophie.pierard@psp.ucl.ac.be
 
Cette recherche a pour objectif la validation d’une méthodologie pour l’étude de marqueurs de la segmentation dans un grand corpus de textes. Deux indices signalant plus ou moins efficacement les ruptures thématiques dans un texte sont proposés. Le premier s’appuie sur la présence de marques de paragraphe et emploie le rapport des chances pour identifier les meilleurs marqueurs. Le second prend en compte la cohésion lexicale par l’entremise d’un indice issu de l’analyse sémantique latente. Ces deux indices ont été appliqués principalement à l’étude des expressions adverbiales temporelles dans des textes littéraires. Les analyses effectuées confirment une série d’hypothèses linguistiques au sujet de la fonction de marqueur de la segmentation de ces expressions.