Ressource pédagogique : Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole
Présentation de: Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole
Informations pratiques sur cette ressource
Droits réservés à l'éditeur et aux auteurs.
Description de la ressource pédagogique
Description (résumé)
JEP-TALN-RECITAL 2016 - Mercredi 6 juillet 2016 Session commune JEP/TALN 1 Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole Sahar Ghannay, Yannick Estève, Nathalie Camelin, Camille Dutrey, Fabian Santiago and Martine Adda-Decker Résumé : Récemment, l'utilisation des représentations continues de mots a connu beaucoup de succès dans plusieurs tâches de traitement du langage naturel.Dans ce papier, nous nous proposons d'étudier leur utilisation pour la tâche de détection des erreurs de transcriptions automatiques de la parole. Dans une architecture neuronale, nous les avons intégrés et évalués, en plus des paramètres classiques (lexicales, syntaxiques,etc.), et d'un ensemble de paramètres prosodiques . De plus, la principale contribution de cet article porte sur la combinaison de différentes représentations : plusieurs approches de combinaison sont proposées et évaluées afin de tirer profit de leur complémentarité. Les expériences sont effectuées sur des transcriptions automatiques du corpus ETAPE générées par le système de reconnaissance automatique du LIUM. Les résultats obtenus sont meilleurs que ceux d'un système état de l'art basé sur les champs aléatoires conditionnels. Pour terminer, nous montrons que la mesure de confiance produite est bien calibrée selon une évaluation en terme d'Entropie Croisée Normalisée.
"Domaine(s)" et indice(s) Dewey
- Informatique appliquée à la linguistique (410.285)
Thème(s)
Document(s) annexe(s) - Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole
- Cette ressource fait partie de
AUTEUR(S)
-
Sahar Ghannay
-
Yannick Estève
-
Nathalie Camelin
-
Camille Dutrey
-
Fabian Santiago
-
Martine Adda-Decker
EN SAVOIR PLUS
-
Identifiant de la fiche
32433 -
Identifiant
oai:canal-u.fr:32433 -
Schéma de la métadonnée
- LOMv1.0
- LOMFRv1.0
- Voir la fiche XML
-
Entrepôt d'origine