La premiere etape mobilise la partie la plus fiable de la grammaire - la description des segments minimaux (chunks) - et peut reposer sur un superetiquetage (supertagging). Les interdependances entre chunks sont a prendre en compte de facon heuristique ou par une analyse complete. Cette analyse est consideree dans une deuxieme phase. En cas d’echec et d’analyses partielles, une derniere etape detecte localement certaines extragrammaticalites ou erreurs de reconnaissances, et poursuit l’analyse par des adaptations locales et des operations de composition dediees.
Pour selectionner les analyses qui minimisent les risques d’incommunicabilite, nous mobilisons les resultats des trois phases d’analyse, ainsi que des predictions sur les actes de dialogue et sur les processus referentiels. Les arbres elementaires sont alors exploites en tant que marques syntaxiques d’actes de dialogue. Les semes associes aux arbres elementaires dans le lexique sont exploites, quant a eux, pour associer un score de discrimination referentiel aux expressions referentielles minimales.
Pour valider notre approche, ces propositions sont evaluees sur une application d’amenagement d’interieurs et une application de consultation de programmes televises.
Abstract
Our work addresses the coupling of speech recognition and natural language processing for Man-Machine spoken interfaces (voice + gesture). We investigate a parsing strategy relying on a Context Free Tree Grammar called Tree Furcating Grammar. The furcation is a simplification of the adjunction operation used in the Tree Adjoining Grammar formalism.
We want to make use of application-based constraints under the form of minimal semantic features. We synchronize specific semantic constraints and feature reorganization mechanisms with the syntactic operations between trees. Three parsing stages can then question the speech recognizer hypothesis.
In a first stage, our parsing strategy focuses on the grammatical chunks. It can rely on the pattern recognition aspect of parsing, namely a supertagging. Interdependencies between chunks are taken into account by heuristics or by a complete analysis (in a second parsing stage). When the parsing fails, a third pass consists in detecting ill-recognized words and oral phenomena. Local adaptation and additional parsing rules are applied in order to extend the analysis.
Considering the limitations of spoken dialogue systems, the selection of the best hypothesis is achieved according to the dialogue options and pragmatic criteria. The latter consists in predictions on the referring process and on the next dialogue act. We make use of elementary trees as syntactic markers of the performed dialogue act. On the other hand, we use the semantic features which are attached to the trees to associate a discrimination score to each minimal referring expression.
This approach has been evaluated within the scope of vocal interactions with a multimodal design application, and a spoken dialogue systems for multimedia database access.
Grenoble, Maison Jean Kuntzmann, Salle de conference 110 avenue de la Chimie et 351 avenue de la Bibliotheque Campus Universitaire de Saint Martin d’Heres
Vous etes bien sur cordialement convie(e) au pot qui suivra.
Je vous invite egalement a diffuser cette annonce