Traduire la parole : le cas des TED Talks

Natalia Segal*, Hélène Bonneau-Maynard*,** et François Yvon*
*LIMSI-CNRS, 91403 Orsay
**Université Paris-Sud, 91400 Orsay natalia.segal,helene.maynard,francois.yvon@limsi.fr
Résumé
L’amélioration continue des performances des systèmes statistiques de traduction automatique, comme celle des outils de reconnaissance vocale, ouvrent de nouvelles perspectives pour le développement d’applications de traduction automatique de la parole. En nous appuyant sur notre expérience de développement de systèmes pour des traductions de conférences, nous analysons et essayons de quantifier les difficultés principales auxquelles continuent de faire face les développeurs d’outils de traduction de parole, en tout premier lieu le manque de corpus oraux parallèles, et présentons diverses manières de les contourner.
Résumé (en anglais)
The continuous improvement of the quality of machine translation and of speech recognition systems opens new perspectives for the development of spoken translation applications. In this study, based on our own experience with the development of Spoken Translation Systems (STS) for conferences, we analyze and quantify the main difficulties raised by STSs, and discuss possible strategies to migitate these issues.
Document
Rank
1