Le développement d’une plate-forme pour l’annotation spécialisée de documents Web : retour d’expérience

Thierry Hamon* et Adeline Nazarenko*
*LIPN - UMR 7030, Université Paris 13 - CNRS; 99, av. J-B Clément; F-93430 Villetaneuse; (thierry.hamon, adeline.nazarenko)@lipn.univ-paris13.fr
Résumé
Au-delà des moteurs de recherche généralistes, des outils capables d’interroger des collections documentaires spécialisées doivent être proposés pour répondre à des besoins d’information précis. Cela suppose une analyse sémantique adaptée à la collection de documents et au domaine considérés. C’est l’objectif de la plate-forme d’annotation Ogmios décrite ici. Des solutions sont proposées pour résoudre les contraintes opérationnelles et les problèmes d’interopérabilité spécifiques à ce cadre applicatif : la distribution les traitements, l’encapsulation des outils de TAL intégrés, et la définition d’une architecture unique pour l’annotation de gros volumes de documents et la construction de ressources spécialisées à partir d’un corpus d’acquisition. Les performances obtenues pour l’annotation des documents issus du Web sont compatibles avec le rythme de leur récupération. Nous montrons également comment cette plate-forme a été intégrée dans un moteur de recherche spécialisé.
Document
Rank
5