Analyse conjointe du signal sonore et de sa transcription pour l’identification nommée de locuteurs

Vincent Jousse*,**, Sylvain Meignier*, Christine Jacquin**, Simon Petitrenaud*, Yannick Estève* and Béatrice Daille**
*LIUM; Université du Maine, Avenue Laënnec; 72085 Le Mans Cedex
**LINA; 2 rue de la Houssinière; BP 92208; 44322 Nantes Cedex 03; prénom.nom@univ-lemans.fr ou prénom.nom@univ-nantes.fr 
Résumé
Depuis quelques années, le traitement de très grandes collections de documents multimédias devient crucial pour certaines applications comme les systèmes d’indexation ou de recherche documentaire. Mais ces collections ne peuvent être traitées manuellement avec un coût raisonnable : seuls les systèmes automatiques apportent une solution viable. Dans ce document, nous traiterons de l’extraction automatique de l’identité du locuteur (prénom et patronyme) présente dans les enregistrements sonores. À partir des résultats d’un système de transcription enrichie, nous présentons une méthode qui vise à extraire l’identité des locuteurs de la transcription et à l’assigner aux différents tours de parole. Le système a été évalué sur des enregistrements radiophoniques provenant de la campagne d’évaluation ESTER 1 phase II.
Paru dans