Inférence de règles de propagation syntaxique pour l’alignement de mots

Sylwia Ozdowska* and Vincent Claveau**
*CLLE/ERSS - CNRS & Université de Toulouse Le Mirail; ozdowska@univ-tlse2.fr
**IRISA – CNRS;Campus de Beaulieu;35042 Rennes cedex; vincent.claveau@irisa.fr
Résumé
Cet article présente et évalue une approche originale d’alignement automatique de bitexte au niveau des mots. Pour cela, elle tire parti d’une analyse syntaxique en dépendances et utilise une technique d’apprentissage artificiel, la programmation logique inductive, pour apprendre des règles dites de propagation. Celles-ci s’appuient sur les informations syntaxiques connues pour aligner les mots avec grande précision. La méthode est entièrement automatique et ne requiert que peu de données d’entraînement ; les résultats présentés montrent qu’elle se compare aux meilleures techniques existantes. Enfin, l’examen des règles inférées permet d’identifier facilement les cas d’isomorphismes syntaxiques entre les deux langues traitées.
Paru dans