Lifat

Submitted by denis.maurel on Mon, 09/07/2020 - 13:15

Une des évolutions marquantes des recherches de l’axe Tal du Lifat a été celle du développement de plus en plus marqués de traitements utiles à l’extraction d’information et la recherche d’information dans les documents numériques dont la modalité peut aussi bien être l’écrit que l’oral (parole transcrite). Dans ce cadre, les activités sont centrés autour des traitements et ressources mobilisées par le passage du MOT (langue), telle qu’il apparait dans le document, au CONCEPT, c’est-à-dire à un niveau sémantique qui permet de faire le lien avec l’ingénierie des connaissances (web sémantique). Nous nous intéressons ainsi à différents niveaux de traitements qui constituent des barrières essentielles dans la mise en œuvre d’une recherche d’information précise et robuste.

Parmi les réalisations de l'équipe se trouvent des ressources linguistiques (dictionnaire relationnel multilingue de noms propres Prolexbase, corpus Ancor annoté en coréférence...) et des réalisations logicielles (CasEN pour la reconnaissance d'entités nommées, Multiflex pour la flexion des formes polylexicales, Sybille pour la communication augmentée des personnes handicapées...). L'équipe fait partie des contributeurs à la plateforme libre Unitex.

Thématiques principales
Détection en documents de mots d'intérêt : reconnaissance des entités nommées (système CasEN, corpus annotés), reconnaissance et analyse des entités polylexicales (projets Parseme).
Mise en relations des mots d'intérêt en documents : résolution de la coréférence (corpus Ancor), et identification de relations temporelles.
Mise en relation avec des concepts du web sémantique : entity linking (LOD).
Humanités Numériques (projets Biblimos et Renom).
Aide au handicap dans le domaine des systèmes de communication augmentée (système Sibylle)
Lieu

37000 Tours
France

41000 Blois
France

Tutelle(s)
Université de Tours
Responsable de l'équipe
Jean-Yves ANTOINE
Taille
5
Nombre de permanents
4