Extraction et regroupement de relations entre entités pour l’extraction d’information non supervisée

Wei Wang*, Romaric Besançon*, Olivier Ferret*, Brigitte Grau**

* CEA, LIST, Laboratoire Vision et Ingénierie des Contenus 91191 Gif-sur-Yvette Cedex, France wei.wang@lip6.fr,romaric.besancon,olivier.ferret@cea.fr

** LIMSI, UPR-3251 CNRS-DR4, Bât. 508, BP 133, 91403 Orsay Cedex brigitte.grau@limsi.fr

 

Cet article se situe dans le cadre de l’extraction d’information non supervisée en domaine ouvert en se concentrant sur l’extraction et le regroupement à large échelle de relations entre entités nommées de type non défini a priori. L’étape d’extraction combine l’utilisation de critères simples mais efficaces et une procédure de filtrage à base d’apprentissage. L’étape de regroupement organise quant à elle les relations extraites pour en caractériser le type selon une stratégie multiniveau permettant de prendre en compte à la fois un volume important et des critères de regroupement élaborés. Les évaluations menées montrent que cette approche a la capacité d’extraire des relations a
Document: