Aide à la rédaction - Apports du Traitement Automatique des Langues

Dates importantes
  • Date de la journée : 3 juin 2006
  • Date limite de soumission : 25 avril 2006
  • Date de notification aux auteurs : 15 mai 2006
  • Date pour les versions finales : 26 mai 2006

Objectifs de la journée

La production de texte est une tâche hautement complexe, du fait du nombre de tâches élémentaires interdépendantes. Un des objectifs de cette journée d’études est d’identifier les apports possibles du TAL pour venir en aide aux rédacteurs. En effet, les thèmes proposés correspondent aux tâches à accomplir par les rédacteurs, dont certaines trouvent leurs équivalents directs dans les système de génération automatique de textes.

Ces dernières décennies, un effort important a été fait pour assurer une exploitation efficace des documents électroniques. Les propositions de la TEI (Text Encoding Initiative) concernant la standardisation de l’encodage et de l’échange de documents en sont un exemple. Des langages de structuration comme le XML ou le SGML sont de plus en plus utilisés par les rédacteurs professionnels pour assurer une certaine bonne formation des documents. Des normes, instanciées tout d’abord sous forme de guides de bonnes pratiques, puis de langues contrôlées, ont été progressivement intégrées dans les processus de production de documents pour permettre un meilleur usage des documents techniques. Le fort besoin de multilinguisme a également eu un impact non négligeable sur les pratiques de rédaction professionnelle.

Les problèmes de lisibilité (compréhension des documents) mettent à jour les contraintes qu’il faut respecter lors de la création des documents. Or, il semble que la plupart des normes apparues compliquent souvent la tâche du rédacteur plus qu’elles ne la facilitent. Si le "tout automatique" ne semble pas être accepté par les rédacteurs professionnels, il semble néanmoins nécessaire d’assister les rédacteurs dans certaines tâches afin de leur permettre de produire de meilleurs documents de la façon la plus efficace et de la manière la moins contrainte possible (ce qui implique qu’on définisse les caractéristiques de bonne formation des documents). Cette remarque vaut également pour la rédaction non-professionnelle, dans la mesure ou bon nombre d’utilisateurs du web rédigent fréquemment en langue étrangère.

Les outils commerciaux et les projets de recherche allant dans ce sens se multiplient : correcteurs orthographiques et grammaticaux, vérificateurs de langues contrôlées, mémoires de rédaction et de traduction, génération multilingue interactive, etc. Cependant, on regrettera un certain manque d’unité et le fait que les apports potentiels du TAL pour assister les rédacteurs ne soient pas davantage mis en avant dans les rencontres scientifiques. Il est d’ailleurs tout à fait intéressant d’observer comment les outils développés pour l’analyse des documents (ex : analyse de la structure des documents, analyse syntaxique, résolution d’anaphores, etc.) se comportent pour apporter de l’aide aux rédacteurs.

Cette journée d’étude de l’ATALA vise à expliciter les parties du processus rédactionnel pour lesquelles des aides proposées par la communauté du TAL existent, et celles pour lesquelles rien n’existe à l’heure actuelle. Nous espérons réunir autour de ce thème des professionnels de la rédaction, des acteurs industriels du domaine, ainsi que des chercheurs en TAL. Thèmes de la journée

La journée commencera par une conférence invitée par un professionnel de la rédaction qui exposera les méthodes de travail en usage et les attentes d’aide provenant de l’informatique et du TAL en particulier. Nous invitons la soumission de propositions de présentations de rapports d’expériences et de développements de systèmes de TAL en relation avec les thèmes suivants (liste non limitative) :

  • aide à la structuration des documents
  • correction orthographique et grammaticale et analyse stylistique
  • accès aux ressources lexicales et terminologiques
  • aide à la rédaction en langue contrôlée
  • aide à la rédaction libre
  • aide à la rédaction en langue étrangère
  • mémoires de rédaction
  • aides visuelles

Organisation

Deux types de présentations sont proposées :

  • communications orales (environ 30mn de présentation, proposition sur deux à quatre pages)
  • démonstrations (une ou deux pages présentant les caractéristiques de la ressource : architecture, couverture, type d’information, etc.)

Les propositions seront à envoyer à : Aurélien Max (aurelien.max@limsi.fr merci de préciser [ATALA] dans le début du titre) au plus tard le 3 avril 2006. Elles devront être rédigées en français pour les francophones, et pourront être rédigées en anglais pour les non-francophones. Les résumés seront publiés après la journée sur le site de l’ATALA.

Programme
  • 09.30-10.00 Introduction à la journée Nicolas Hernandez, Aurélien Max, Michael Zock
  • 10.00-10.30 Conférence invitée (titre à préciser) Eric Azan, rédacteur en chef technique, Le Monde
  • 10.30-10.45 Pause café-croissants
  • 10.45-11.15 Outils d’analyse textuelle d’aide à l’acquisition du français langue étrangère écrit Isabelle Audras et Jean-Gabriel Ganascia, Laboratoire d’Informatique de Paris 6 (LIP6), Université Paris 6
  • 11.15-11.45 (Logiciel Antidote - titre à préciser) Eric Brunelle, Société Druide Informatique, Montréal
  • 11.45-12.05 Les corpus au service de l’apprentissage de l’allemand au collège et à l’université Eva Lacroix, Université Paris 3
  • 12.05-14.00 Pause déjeuner
  • 14.00-14.30 (Logiciel Cordial - titre à préciser) Dominique Laurent, Société Synapse Développement, Toulouse
  • 14.30-15.00 L’apprentissage de l’écriture : du traitement de texte aux outils d’aide à l’écriture Pierre-André Buvet, Olivier Hu, Fabrice Isaac, Laboratoire de Linguistique Informatique (LLI), Université Paris 13
  • 15.00-15.30 Des corpus bilingues alignés annotés sémantiquement pour l’aide à la rédaction : application aux collocations de la langue scientifique générale Olivier Kraif, Agnès Tutin, Laboratoire de linguistique et didactique des langues étrangères et maternelles (LIDILEM), Université Grenoble 3
  • 15.30-15.45 Pause café
  • 15.45-16.15 (Logiciel Prolexis - titre à préciser) Roger Rainero, Société Diagonal
  • 16.15-16.45 Vérification automatique de définitions terminographiques Selja Seppälä, Département de traitement informatique multilingue, Université de Genève
  • 16.45-17.00 Clôture de la journée Nicolas Hernandez, Aurélien Max, Michael Zock
Date
3 juin 2006
Lieu

ENST
46, rue Barrault
75013 Paris
France

Organisateur(s)
Nicolas Hernandez (GREYC)
Aurélien Max (LIMSI)
Michael Zock (LIF)