Antelope : une plate-forme industrielle de traitement linguistique

François-Régis Chaumartin*
*Société PROXEM (« Procédures Sémantiques »); 7, impasse Dumur; 92110 Clichy; frc@proxem.comÉquipe ALPAGE (INRIA & Université Paris 7); 30, rue du Château-des-Rentiers; 75013 Paris; fchaumartin@linguist.jussieu.fr
Résumé
La plate-forme de traitement linguistique Antelope, en partie basée sur la Théorie Sens-Texte (TST), permet l’analyse syntaxique et sémantique de textes sur des corpus de volume important. Antelope intègre plusieurs composants préexistants (pour l’analyse syntaxique) ainsi que des données linguistiques à large couverture provenant de différentes sources. Un effort d’intégration permet néanmoins d’offrir une plate-forme homogène. Notre contribution directe concerne l’ajout de composants d’analyse sémantique et la formalisation d’un modèle linguistique unifié. Cet article présente la plate-forme et la compare à d’autres projets de référence. Il propose un retour d’expérience d’un éditeur de logiciel vers la communauté du TAL, en soulignant les précautions architecturales à prendre pour qu’un tel ensemble complexe reste maintenable.
Document
Rank
2