Détection de la spécialisation scientifique et technique des documents biomédicaux grâce aux informations morphologiques

Jolanta Chmielik* et Natalia Grabar**
*Commission européenne; DG RTD recherche et innovation; Bruxelles; jolachmielik@hotmail.com
**UMR 8163 STL; CNRS & Université Lille 1&3; Villeneuve d’Ascq; natalia.grabar@univ-lille3.fr
Résumé
La distinction du degré de spécialisation des documents de santé en ligne est une indication importante, surtout lorsque ces documents sont consultés par des utilisateurs non experts, comme le sont les patients. Effectivement, une très grande technicité des documents empêche les patients de bien comprendre le contenu et peut avoir des conséquences négatives sur la gestion de leur maladie et la communication avec les médecins. Lorsque les portails de santé proposent cette distinction, elle est effectuée manuellement. Nous effectuons une catégorisation automatique des pages de la Toile en fonction de leur spécialisation. Nous exploitons l’information morphologique obtenue grâce à l’analyse morphologique des lexèmes. L’évaluation montre que la précision, le rappel et la f-mesure sont souvent supérieurs à 90 %.
Document
Rank
5