Les groupes nominaux complexes et leurs propriétés : application à l'analyse de l'information

Royauté Jean

Équipe: LORIA (Laboratoire Lorrain de Recherche en Informatique et ses applications) et URI (Unité Recherche et Innovation, INIST-CNRS)

Contenu

Mots-clés: structures prédicatives, groupes nominaux complexes, nominalisation, prédicats, terminologie, variation terminologique, analyse de l’information, fouille de données textuelles
Keywords: predicate structures, complex noun phrases, nominalisation, predicate, terminology, terminological variation, information analysis, text mining
Résumé
Je présente dans cette thèse, un ensemble de travaux explorant le concept d’analyse de l’information, dans le contexte de l’Information Scientifique et Technique, pour lequel les groupes nominaux complexes jouent un rôle de premier plan.

Ce mémoire est organisé autour de deux axes. Le premier repose sur l’étude de la variation et de la stabilité des groupes nominaux terminologiques et leur rôle dans le dispositif d’analyse de l’information. Alors que la stabilité d’un terme est la manifestation de la banalisation de la notion qu’il représente, sa variation, au contraire, traduit, dans un grand nombre de cas, une instabilité conceptuelle de la notion, mettant en évidence une activité du domaine, en émergence ou en forte croissance.

Le second de ces axes est consacré à une autre classe de GN complexes : les GN prédicatifs formés à partir de déverbaux. Le principal intérêt de cette structure linguistique est qu’elle est porteuse des éléments d’information essentiels de la phrase : sujets, compléments et circonstants. Le fait que chaque prédicat nominal marque ces arguments sujets ou compléments, à partir d’un sous-ensemble de prépositions spécifiques, permet d’en faciliter l’identification et a conduit à en faire une typologie. Cette typologie est utilisée pour l’identification en corpus des entrées lexicales de ces prédicats, à partir de traitements automatiques sur les verbes et leur nominalisation. Une évaluation de la pertinence de ces entrées lexicales à repérer les bons arguments est faite. L’intérêt d’utiliser les structures prédicatives acquises pour l’interprétation de clusters de termes cooccurrents est montré par la suite.

Abstract
In this thesis I present information analysis concepts in the context of Scientific and Technical Information where complex noun phrases have a predominant role.

This dissertation is organized around two axes. The first is based on variation and stability studies of terminological noun phrases and their role in the information analysis device. While the stability of a term is a sign that the notion which it represents is becoming ordinary, its variation, on the contrary, often reveals a conceptual instability of the notion, underscoring the activity of an emerging or growing sector.

The second axis is devoted to another group of complex NPs : predicative NPs formed with nominalisations of verbs. The main interest of this linguistic structure is that it has information units which are essential to the sentence : subject, complements and adverbial complements. The fact that each noun predicate marks these subject or complement arguments with a subset of specific prepositions eases the identification and leads to making a typology. This typology is used to identify in corpora the lexical entries of these nominal verbs based on the computer processing of verbs and their nominalisation. An assessment is made of the relevance of these lexical entries in their capability to find the right arguments. The interest of using predicate structures acquired for the interpretation of coocurrent term clusters is further developed.  

Informations administratives

Jury
  • M. Jean-Marie Pierrel, Professeur, Université Henri Poincaré, Nancy 1 (Directeur de thèse)
  • M. Paul Sabatier, Chargé de recherche, LIM-CNRS, Marseille (Rapporteur)
  • M. Pierre Zweigenbaum, Ingénieur chercheur, Assistance Publique-DIAM, Paris (Rapporteur)
  • Mme Marie-Christine Haton, Professeur, Université Henri Poincaré, Nancy 1 (Rapporteur)
  • Mme Laurence Danlos, Professeur, Université de Paris 7 (Examinateur)
  • M. Xavier Polanco, Responsable de l’URI, INIST-CNRS, Nancy (Examinateur)
  • M. Yannick Toussain, Chargé de recherche, LORIA-INRIA, Nancy (Examinateur)
Université: Université Henri Poincaré-Nancy 1
Discipline: Informatique
Date de soutenance: 19 juillet 1999
Lieu de soutenance: Nancy