Micro-adaptation lexicale en traduction automatique statistique

Josep Maria Crego*, Gregor Leusch***, Aurélien Max*,**, Hermann Ney*** et François Yvon*,**
*LIMSI-CNRS; B.P. 133; 91403 Orsay cedex; France
**Université Paris Sud 11; 91405 Orsay cedex; France
***Lehrstuhl für Informatik 6 - RWTH; Aachen University; Ahornstr. 55; D-52056 Aachen; Allemagne
Résumé
Nous présentons un cadre générique en traduction automatique statistique (TAS) dans lequel des prédictions lexicales, sous forme d’un modèle de langue local à la phrase à traduire, sont exploitées pour guider la recherche de la meilleure hypothèse de traduction, ce qui a pour effet d’opérer une micro-adaptation lexicale. Nous proposons une instanciation de ce cadre qui est évaluée sur trois paires de langues : les prédictions auxiliaires proviennent d’autres systèmes de TAS qui réalisent une triangulation via une langue auxiliaire. Une première configuration met en jeu neuf langues auxiliaires, ce qui permet de mesurer la contribution relative de chaque langue. Nous proposons ensuite d’utiliser simultanément ces neuf systèmes, en les combinant par consensus. Nos résultats montrent qu’il est possible d’augmenter les performances d’un système de TAS de manière entièrement automatique en exploitant des sources auxiliaires.
Document
Rank
3