Extraction et capitalisation automatiques de connaissances à partir de documents textuels. SEEK-JAVA : identification et interprétation de relations entre concepts.

Le Priol Florence

Équipe: CAMS-LaLIC

Contenu

Mots-clés: informatique, extraction d information, acquisition de connaissances, terminologie, exploration contextuelle, relations sémantiques, graphes, base de données
Keywords: data processing, information extraction, knowledge acquisition, terminology, contextual exploration, semantic relation, graph, data base
Résumé
Le travail présenté dans cette thèse se situe à la frontière de plusieurs domaines : informatique, extraction d information, acquisition de connaissances, terminologie et linguistique. A partir de conceptualisations sémantiques élaborées dans le cadre d un modèle général de traitement des langues en rapport avec la cognition, le modèle de la Grammaire Applicative et Cognitive (GAC), un premier système automatique a été réalisé en 1993 (Jouis 93) : SEEK. La présente étude a repris certaines des analyses déjà présentées dans SEEK mais notre effort a porté d une part, sur une réanalyse et une réorganisation des connaissances linguistiques et d autre part, sur une nouvelle modélisation faisant usage des potentialités offertes par le langage JAVA de façon à intégrer le modèle de la GAC dans une plate-forme appelée FilText et sa réalisation informatique ContextO. Le système SEEK-JAVA identifie et interprète des relations entre concepts à partir du traitement automatique de textes et fournit les résultats à la fois sous forme de graphes et d une base de données.

Abstract
Work presented in this thesis is situated in the field of several domain : data processing, information extraction, knowledge acquisition, terminology, linguistics. From semantic conceptualizations elaborated within the framework of a general model of processing of languages in touch with the cognition, the Grammar Applicative and Cognitive ( GAC) model, a first automatic system was realized in 1993 (Jouis 93) : SEEK. The present study resumed some of the analyses already presented in SEEK but our effort concerned on one hand, a new analyze and a reorganization of linguistic knowledge and on the other hand, a new modeling making use of potentialities offered by JAVA language so as to integrate this model into a platform called FilText and its computer realization ContextO. SEEK-JAVA system identifies and interprets relations between concepts from text automatic treatment and supplies results on one hand in graph on the other hand in a data base.  

Informations administratives

Jury
  • Marie-France BRUANDET, Professeur, Université Joseph Fourier (Grenoble), Présidente
  • Anne CONDAMINES, Chargée de Recherche CNRS, Université de Toulouse 2
  • Jean-Pierre DESCLES, Professeur, Université Paris -Sorbonne, Directeur de Thèse
  • Christian FLUHR, Professeur, CEA , Rapporteur
  • Geneviève LALLICH, Professeur, Université de Claude Bernard Lyon 1, Rapporteur
  • Jean-Luc MINEL, Ingénieur de Recherche CNRS, Université Paris -Sorbonne
Université: Université Paris-Sorbonne
Discipline: Informatique Linguistique
Date de soutenance: 12 décembre 2000
Lieu de soutenance: ISHA, Paris