Caio Corro*, Gaël Lejeune** et Vlad Niculae***
*INSA Rennes, IRISA, Inria, CNRS, Université de Rennes
**STIH/CERES, Sorbonne Université Paris, France
***Language Technology Lab, IVI, FNWI, University of Amsterdam
Résumé
Les chercheurs en traitement automatique des langues (TAL) sont amenés à traiter des tâches et des données de plus en plus variées. Ce numéro de la revue TAL s’intéresse à la capacité des systèmes de TAL à s’adapter à la variation des données, à leur robustesse. Les articles présentés ici s’intéressent à deux types de données qui questionnent la robustesse : les données générées par des utilisateurs et les données issues de la reconnaissance optique de caractères.
Résumé (en anglais)
Researchers in natural language processing (NLP) are required to address a variety of tasks and data. This issue of the TAL journal focuses on the ability of NLP systems to adapt to data variability, to their robustness. The articles presented here explore two types of data that challenges robustness: user-generated content and data derived from optical character recognition.
Document
Rank
0