Extraction de dates saillantes pour la construction de chronologies thématiques

Rémy Kessler*, Xavier Tannier*, **, Caroline Hagège***, Véronique Moriceau*, **, André Bittar***

* LIMSI-CNRS, Orsay
prenom.nom@limsi.fr

** Université Paris-Sud, Orsay

*** Xerox Research Centre Europe, Meylan
caroline.hagege@xrce.xerox.com, andre.bittar@gmail.com

 

Nous présentons ici une approche pour la détection de dates saillantes (importantes) dans les textes dans le but de construire automatiquement des chronologies événementielles à partir de requêtes thématiques (ex. le nom d’un événement, d’une personne, etc.). Ce travail a été mené sur un corpus de dépêches en français et en anglais fourni par l’Agence France Presse (AFP). Pour extraire les dates saillantes qui méritent de figurer dans une chronologie événementielle, les expressions temporelles dans les textes doivent, dans un premier temps, être reconnues et normalisées. Nous utilisons ensuite une approche par apprentissage pour extraire les dates saillantes pour un thème donné. Nous ne nous intéressons pour le moment qu’à l’extraction des dates et non aux événements associés.