Caractérisation des contenus de l'Internet : au-delà du lexique, l'approche sémantique

Programme

Important : Le samedi, l'accès a l'ENST se fait par la rue Vergnaud (de l'autre côté du pâté de maison par rapport à la rue Barrault). N'oubliez pas de vous munir du programme de la journée ; ce programme vous sera demandé au poste de sécurité.

9h15 Présentation de la journée
9h30 Thomas Beauvisage (France Télécom R&D;) Utiliser les annuaires du Web pour décrire les parcours sur la Toile
10h00 Kamel Smaïli et Armelle Brun (LORIA) Routage automatique de courriers électroniques
10h30 Pause
11h00 Antoine Marzin, Lionel Martin, Christel Vrain et Guillaume Cleuziou (LIFO, U. Orléans) Classification de pages Web en Genre
11h30 Martine Hurault-Plantet (LIMSI-CNRS) Sélection de traits et détection de thèmes pour l'analyse d'un corpus de pages personnelles Web
12h00 Déjeuner et affiches
14h00 Aurélie Névéol, Lina Soualmia, Alexandrina Rogozan, Magaly Douyère, Benoît Thirion, Stéfan Darmoni (CISMeF, Rouen / PSI-CNRS / U. Rouen) Caractérisation des contenus de l'Internet en santé : l'exemple CISMeF
14h30 Mathieu Valette (CRIM, Inalco) Projet Princip : application de règles sémantiques à la détection de documents racistes sur Internet
15h00 Pause
15h30 Monika Nicinski, (CRIM, Inalco) Typologie et description sémantique des images utilisées dans les sites Internet racistes
16h00 François Rastier (CNRS - UMR 7114, Paris X - MoDyCo) La sémiotique du document numérique et son incidence sur les traitements sémantiques
16h30 Table ronde
17h00 Fin de la journée d'étude
Date
31 janvier 2004
Lieu

ENST
49, rue Vergnault
75013 Paris
France

Organisation
François Rastier (CNRS - UMR 7114, Paris X - MoDyCo)
Natalia Grabar (CRIM/INaLCO, STIM/DSI/AP-HP, ERM 202 INSERM)
Thomas Beauvisage (France Télécom R&D; - DIH/UCE, Paris X - MoDyCo)