Alignement monolingue avec recherche de déplacements pour la critique génétique

Julien Bourdaillet*
*Laboratoire RALI; Département d’Informatique et de Recherche Opérationnelle; Université de Montréal; C.P. 6128, succursale Centre-Ville; H3C 3J7, Montréal, Québec, Canada; julien.bourdaillet@umontreal.ca
Résumé
Cet article présente la problématique de l’alignement monolingue avec recherche de déplacements. Celle-ci est posée par la critique génétique, une discipline d’études littéraires. Les solutions informatiques existantes ne sont pas satisfaisantes pour répondre à ce problème NP-difficile. Nous proposons d’emprunter à la bioinformatique et l’algorithmique textuelle une famille d’algorithmes appelée alignement par fragments. Une adaptation de ce type d’algorithmes pour le TAL est décrite. Notre méthode permet d’aligner deux textes en recherchant les déplacements, au caractère près, en passant à l’échelle, et pour n’importe quelle langue alphabétique. Une évaluation expérimentale présente les bons résultats obtenus face à d’autres méthodes.
Paru dans