Ce mémoire est organisé autour de deux axes. Le premier repose sur l’étude de la variation et de la stabilité des groupes nominaux terminologiques et leur rôle dans le dispositif d’analyse de l’information. Alors que la stabilité d’un terme est la manifestation de la banalisation de la notion qu’il représente, sa variation, au contraire, traduit, dans un grand nombre de cas, une instabilité conceptuelle de la notion, mettant en évidence une activité du domaine, en émergence ou en forte croissance.
Le second de ces axes est consacré à une autre classe de GN
complexes : les GN prédicatifs formés à partir de déverbaux.
Le principal intérêt de cette structure linguistique est
qu’elle est porteuse des éléments d’information essentiels
de la phrase : sujets, compléments et circonstants. Le fait
que chaque prédicat nominal marque ces arguments sujets
ou compléments, à partir d’un sous-ensemble de prépositions
spécifiques, permet d’en faciliter l’identification et a
conduit à en faire une typologie. Cette typologie est utilisée
pour l’identification en corpus des entrées lexicales de ces
prédicats, à partir de traitements automatiques sur les
verbes et leur nominalisation. Une évaluation de la pertinence
de ces entrées lexicales à repérer les bons arguments est faite.
L’intérêt d’utiliser les structures prédicatives acquises pour
l’interprétation de clusters de termes cooccurrents est montré
par la suite.
Abstract
In this thesis I present information analysis concepts
in the context of Scientific and Technical Information
where complex noun phrases have a predominant role.
This dissertation is organized around two axes. The first is based on variation and stability studies of terminological noun phrases and their role in the information analysis device. While the stability of a term is a sign that the notion which it represents is becoming ordinary, its variation, on the contrary, often reveals a conceptual instability of the notion, underscoring the activity of an emerging or growing sector.
The second axis is devoted to another group of complex
NPs : predicative NPs formed with nominalisations of
verbs. The main interest of this linguistic structure
is that it has information units which are essential
to the sentence : subject, complements and adverbial
complements. The fact that each noun predicate marks
these subject or complement arguments with a subset
of specific prepositions eases the identification and
leads to making a typology. This typology is used
to identify in corpora the lexical entries of these
nominal verbs based on the computer processing of
verbs and their nominalisation. An assessment is
made of the relevance of these lexical entries in
their capability to find the right arguments.
The interest of using predicate structures acquired
for the interpretation of coocurrent term clusters
is further developed.