Analyse lexicale outillée de la parole transcrite de patients schizophrènes

Maxime Amblard*, Karën Fort** Caroline Demily***, Nicolas Franck*** et Michel Musiol****
*LORIA, UMR 7503, Université de Lorraine, CNRS, Inria
**Université Paris-Sorbonne / EA STIH
***UMR 5229 CH le Vinatier CNRS, Université Lyon 1
****ATILF, UMR 7118, Université de Lorraine, CNRS
Résumé
Cet article détaille les résultats d’analyses réalisées sur la transcription d’entretiens avec des patients schizophrènes, aux niveaux de la production orale (disfluences) et du lexique (morpho-syntaxe et lemmes). Le cadre général du projet prévoit d’autres niveaux d’analyse (syntaxique et du discours), les résultats obtenus devant nous permettre de réfuter ou d’identifier de nouveaux indices linguistiques présents dans la manifestation d’un dysfonctionnement à ces différents niveaux. Le corpus traité contient plus de 375 000 mots, son analyse a donc nécessité l’utilisation d’outils de traitement automatique des langues (TAL) et de textométrie. Nous avons en particulier séparé le traitement des disfluences du traitement lexical, ce qui nous a permis de montrer que si les schizophrènes produisent davantage d’achoppements et de répétitions (disfluences) que les témoins, la richesse de leur lexique n’est pas significativement différente.
Résumé (en anglais)
This article details the results of analyses we conducted on the discourse of schizophrenic patients, at the oral production (disfluences) and lexical (part-of-speech and lemmas) levels. This study is part of a larger project, which includes other levels of analyses (syntax and discourse). The obtained results should help us rebut or identify new linguistic evidence participating in the manifestation of a dysfunction at these different levels. The corpus contains more than 375,000 words, its analysis therefore required that we use Natural Language Processing (NLP) and lexicometric tools. In particular, we processed disfluencies and parts-of-speech separately, which allowed us to demonstrate that if schizophrenic patients do produce more disfluencies than control, their lexical richness is not significatively different.
Document
Rank
3