Linguistic Diversity in Natural Language Processing

Aarne Ranta* et Cyril Goutte**
*University of Gothenburg, Department of Computer Science and Engineering
**Conseil national de recherches Canada, Technologies numériques
Résumé
Bien que la linguistique informatique porte en elle la promesse d’outils aidant au traitement et à la compréhension d’une multitude de langues, la majorité des travaux en TAL porte encore sur un petit nombre de langues, et en particulier sur l’anglais. L’objectif de ce numéro spécial est de promouvoir la diversité linguistique en TAL en encourageant la présentation de travaux portant sur des langues ou variantes de langues moins souvent traitées, ainsi que sur des méthodes qui peuvent être aisément appliquées à celles-ci. Deux articles sont inclus dans ce numéro, l’un sur l’identification de la langue pour constituer une ressource pour la langue corse, l’autre sur la traduction de deux langues autochtones du nord du Canada.
Résumé (en anglais)
Although computational linguistics carries the promise of producing tools for processing and understanding a wide variety of languages, most of the work in NLP still focuses on a small number of languages, and in particular on English. The goal of this special issue is to promote linguistic diversity in NLP, by encouraging the publication of work on languages or language varieties less often studied, as well as methods that can easily and demonstrably be applied to those. Two articles are included in this special issue, one on language identification for building a resource for the Corsican language, the other on machine translation of two indigenous languages of northern Canada.
Document
Rank
0