Accueil du site Accueil du site Adhésion Contact Plan du site

Une interface pour l’exploitation de corpus arborés par des non-informaticiens : la plate-forme ScienQuest du projet Scientext

Achille Falaise*, Agnès Tutin**, Olivier Kraif**

*GETALP-LIG
BP 53, 38041 Grenoble cedex 9
achille.falaise@imag.fr

**LIDILEM
Université Stendhal
UFR SdL, BP 25, 38040 Grenoble cedex 9
agnes.tutin@u-grenoble3.fr
olivier.kraif@u-grenoble3.fr


La communauté du TAL développe de nombreux corpus, souvent librement disponibles, disposant d’annotations riches mais difficilement utilisables pour des chercheurs non informaticiens. Si la communauté du TAL souhaite ouvrir ses corpus annotés à un public plus large, elle doit impérativement concevoir et déployer des interfaces simples, ce qui n’est pas un problème trivial. Dans cet article, nous réfléchissons, dans le cadre du projet Scientext, aux critères ergonomiques et aux méthodes permettant d’élaborer un système de requêtes facile d’accès et soulignons les limites de la plupart des outils existants. Nous présentons la plate-forme ScienQuest, conçue pour effectuer sans connaissances techniques préalables des recherches sur les parties textuelles, les parties du discours et les fonctions syntaxiques. Conformément à nos attentes, une première évaluation montre une préférence marquée pour les modes de recherche les plus simples. Au-delà du projet Scientext, l’environnement ScienQuest, conçu comme un outil générique, devrait permettre d’intégrer rapidement de nouvelles ressources textuelles libres.


Télécharger:
Fichier PDF
Achille Falaise, Agnès Tutin, Olivier Kraif
272.1 ko

TAL Volume 52 2011 . 3. Ressources Linguistiques Libres

Date de dernière mise à jour : 6 octobre 2012, auteur : Rédacteurs en chef.