Un modèle hybride pour le textual data mining : un mariage de raison entre le numérique et le linguistique

Auteurs
Biskri, Ismaïl
Delisle, Sylvain
Résumé
Une des recherches de pointe menée actuellement en informatique est l’extraction des connaissances dans un texte électronique (textual data mining). Ce thème de recherche est de première importance pour les technologies de l’information qui sont confrontées à des marées de documents électroniques. Pour résoudre ce problème, plusieurs stratégies sont possibles : les unes relèvent des mathématiques et les autres de l’informatique linguistique. Nous présentons dans cet article un modèle hybride, à la fois robuste et fin, qui s’inspire des modèles neuronaux et de l’analyse linguistique informatique.
Mots-clés
structure prédicative
groupe nominal
extraction
extraction de connaissances
représentation matricielle
Document