Validation interne et externe d’indices phraséologiques pour l’évaluation automatique de textes rédigés en anglais langue étrangère

Yves Bestgen*
*Centre for English Corpus Linguistics, Université catholique de Louvain, B-1348 Louvain-la-Neuve Belgique
Résumé
Cette étude s’inscrit dans le champ de l’évaluation automatique de textes rédigés en langue étrangère, un domaine d’application du TALP en didactique très actif. Elle vise à évaluer d’une manière approfondie l’utilité d’y prendre en compte des mesures automatiques de la compétence phraséologique en raison de son importance lors de l’apprentissage d’une langue étrangère. Les indices phraséologiques employés sont obtenus par l’analyse de tous les bigrammes de mots présents dans un texte d’apprenants auxquels des scores d’association sont attribués sur la base d’un grand corpus natif. Les analyses effectuées sur trois ensembles de textes indiquent que ces indices apportent une information utile pour estimer la qualité des textes et que celle-ci est différente de celle apportée par des mesures lexicales plus simples. Une validation externe, réalisée en apprenant et en testant le modèle prédictif sur des ensembles de textes très différents, montre que ces indices présentent un degré de généralisation important.
Paru dans
Document
Rank
4