Étude et intégration de contraintes contextuelles dans la compréhension automatique du français

Mouret Pascal

Équipe: Laboratoire d'Informatique de Marseille

Contenu

Mots-clés: référence, anaphores, contexte linguistique, aide à la composition, représentation du sens, représentation du contexte, pluriel
Keywords: reference, anaphorae, linguistic context, guided composition, representation of meaning, contextual representation, plural
Résumé
Ce mémoire de thèse est consacré à l’étude de problèmes liés à la référence. Dans la lignée des travaux sur les anaphores et la représentation du discours de H. Kamp et de J. Groenendijk et M. Stokhof, nous nous intéressons à modéliser les groupes nominaux référentiels et leurs rapports au contexte linguistique et à réaliser une application à partir de ces résultats.

Le cadre théorique, algorithmique et applicatif dans lequel s’inscrit cette étude s’articule autour de deux points principaux :

   distinction de différents niveaux de bonne formation et de représentation d’une phrase (niveaux lexical, syntaxique, sémantique, conceptuel et contextuel) ;

   analyse, synthèse et aide à la composition de phrases par coroutinage de contraintes sur ces différents niveaux.

Elle se décompose en trois parties :

1. J’argumente une définition du niveau contextuel en termes d’individus et de propriétés, articulée autour des notions de contexte linguistique, référence et interprétation.

Puis, je m’attache à étudier la nature du rapport qu’entretiennent les différents groupes nominaux référentiels avec le contexte ainsi que les règles permettant d’identifier les entités auxquelles ils réfèrent. J’introduis notamment la distinction entre entités réelles et potentielles, pour traiter certains problèmes entre référence et quantification universelle.

Enfin, je présente les points essentiels des formalismes de représentation du sens et de représentation du contexte.

2. Je présente une application effective de ces résultats dans le cadre du projet ILLICO, et je décris des algorithmes originaux pour tenir compte des problèmes de résolution au plus tôt liés à l’approche d’aide à la composition. En particulier, je montre que le critère classique d’unicité du référent n’est plus suffisant pour la résolution des groupes nominaux définis.

3. Je présente certains problèmes connexes, et notamment une approche originale de la représentation du pluriel.

Abstract
This thesis focuses on the study of problems linked to the notion of reference. Following the works on anaphors and discourse representation by Hans Kamp or Jeroen Groenendijk and Martin Stokhof, we tackle the modelisation of referential noun phrases and of their dependencies on the linguistic context. The theoretic, algorithmic and applicational framework of this study relies on two main features :

   a distinction between different levels of well-formedness and representation of sentences (lexical, syntactic, semantic, conceptual and contextual levels) ;

   analysis, synthesis and guided composition of sentences by coroutining constraints on those different levels.

This study is divided in three parts :

1. I argue a definition of the contextual level in terms of individuals and properties, and based upon the notions of linguistic context, reference and interpretation. I then proceed with the study of the links that obey between the different referential noun phrases and the context as well as the rules that enable us to point out the entities they are referring to. In particular, I introduce a distinction between "real" entities and potential entities, in order to solve some problems stemming from reference and universal quantification. Finally, I present the essential features of a formalism of representation of the meaning and of a formalism of representation of the context.

2. I show an actual implementation of these results in the ILLICO project, and I describe original algorithms that deal with problems of early resolution stemming from the guided composition approach. In particular, I show that the usual criterion of unicity of the referent is not enough for the resolution of definite noun phrases in this respect.

3. I tackle some related problems, mainly an original approach to the representation of the plural.  

Informations administratives

Jury
  • Jose Gabriel PEREIRA LOPES, Chercheur Principal (Portugal) - Rapporteur
  • Patrick SAINT-DIZIER, Directeur de Recherche CNRS - Rapporteur
  • Paul SABATIER, Chargé de Recherche 1e classe CNRS - Directeur de thèse
  • Robert PASERO, Maître de Conférence -
  • Michel ROUX, Professeur
Université: Université de la Méditerranée (Aix-Marseille II)
Discipline: Informatique
Date de soutenance: 20 juillet 2000
Lieu de soutenance: Faculté des Sciences de Luminy