Vers un système d’analyse syntaxique robuste pour l’Arabe : Application au recouvrement des erreurs de la reconnaissance

Auteurs
Aloulou, Chafik
Hadrich Belguith, Lamia
Ben Hamadou, Abdelmajid
Résumé
Le degré de profondeur et de finesse de l’analyse syntaxique d’un texte écrit dépend énormément de l’objectif de l’analyse (analyse globale, analyse partielle, analyse détaillée, etc.) ainsi que du type d’application nécessitant cette analyse. Dans cet article, nous présentons une approche originale d’analyse syntaxique robuste appliquée à l’arabe et basée sur l’architecture multiagent. Comme première application de notre approche, notre système sera couplé avec un système de reconnaissance de l’écriture arabe dans le but d’effectuer, d’une part, la validation linguistique des mots reconnus par l’OCR (Optical Character Recognition) et d’autre part la détection et la correction des erreurs d’ordre lexicales, morphologiques, syntaxiques (cas des erreurs d’accord) et qui sont dues à la non ou au mal reconnaissance de certains mots par l’OCR. Le couplage de notre système avec le système de reconnaissance de l’écriture arabe entre dans le cadre d’un projet de coopération avec l’équipe Perception, Système et Information (PSI) de l’université de Rouen.
Mots-clés
analyse syntaxique
analyse syntaxique robuste
langue
langue arabe
corpus
système de reconnaissance
système de reconnaissance de l’écriture arabe