Introduction to the Special Issue on Cross-modal and Multimodal Natural Language Processing

Gwénolé Lecorvé* and John D. Kelleher**
*Orange, Lannion, France
**ADAPT Research Centre, Maynooth University, Ireland
Résumé
Notre communication étant multimodale par notre capacité à nous exprimer via différents canaux et notre perception du monde, la production et l’analyse automatiques d’énoncés en langage naturel nécessitent d’intégrer ces multiples modalités pour rivaliser avec la performance de l’humain. Pourtant, le Traitement Automatique des Langues (TAL) multimodal, ou inter-modal, est longtemps resté un pan minoritaire, peut-être car plus complexe. Dans la lignée des récentes avancées en intelligence artificielle qui mettent la multimodalité sur le devant de la scène, ce numéro spécial vise à souligner, à travers trois articles aux sujets variés, les questionnements qui subsistent, notamment sur les besoins de données, la compréhension des liens entre modalités et le besoin de convergence en termes de représentation et de modélisation.
Résumé (en anglais)
Since our communication is multimodal in terms of our ability to express ourselves via different channels and our perception of the world, the automatic production and analysis of natural language content requires the integration of these multiple modalities in order to rival human performance. However, multimodal, or cross-modal, Natural Language Processing (NLP) has long been in the minority, perhaps because it is more complex. In the wake of recent advances in artificial intelligence, which are bringing multimodality to the fore, this special issue aims to highlight, through three articles on a variety of subjects, the questions that remain, particularly with regard to data requirements, understanding the links between modalities, and the need for convergence in terms of representation and modelling.
Document
Rank
0