Alignement monolingue avec recherche de déplacements pour la critique génétique

Julien Bourdaillet
 
Laboratoire RALI
Département d’Informatique et de Recherche Opérationnelle
Université de Montréal
C.P. 6128, succursale Centre-Ville
H3C 3J7, Montréal, Québec, Canada
julien.bourdaillet@umontreal.ca
 
Cet article présente la problématique de l’alignement monolingue avec recherche de déplacements. Celle-ci est posée par la critique génétique, une discipline d’études littéraires. Les solutions informatiques existantes ne sont pas satisfaisantes pour répondre à ce problème NP-difficile. Nous proposons d’emprunter à la bioinformatique et l’algorithmique textuelle une famille d’algorithmes appelée alignement par fragments. Une adaptation de ce type d’algorithmes pour le TAL est décrite. Notre méthode permet d’aligner deux textes en recherchant les déplacements, au caractère près, en passant à l’échelle, et pour n’importe quelle langue alphabétique. Une évaluation expérimentale présente les bons résultats obtenus face à d’autres méthodes.