Ressource pédagogique : Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole

cours / présentation - Date de création : 06-07-2016
Partagez !

Présentation de: Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole

Informations pratiques sur cette ressource

Langue du document : Français
Type pédagogique : cours / présentation
Niveau : enseignement supérieur, doctorat
Durée d'exécution : 27 minutes 29 secondes
Contenu : image en mouvement
Document : video/mp4
Taille : 133.38 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource pédagogique

Description (résumé)

JEP-TALN-RECITAL 2016 - Mercredi 6 juillet 2016 Session commune JEP/TALN 1 Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole Sahar Ghannay, Yannick Estève, Nathalie Camelin, Camille Dutrey, Fabian Santiago and Martine Adda-Decker Résumé : Récemment, l'utilisation des représentations continues de mots a connu beaucoup de succès dans plusieurs tâches de traitement du langage naturel.Dans ce papier, nous nous proposons d'étudier leur utilisation pour la tâche de détection des erreurs de transcriptions automatiques de la parole. Dans une architecture neuronale, nous les avons intégrés et évalués, en plus des paramètres classiques (lexicales, syntaxiques,etc.), et d'un ensemble de paramètres prosodiques . De plus, la principale contribution de cet article porte sur la combinaison de différentes représentations : plusieurs approches de combinaison sont proposées et évaluées afin de tirer profit de leur complémentarité. Les expériences sont effectuées sur des transcriptions automatiques du corpus ETAPE générées par le système de reconnaissance automatique du LIUM. Les résultats obtenus sont meilleurs que ceux d'un système état de l'art basé sur les champs aléatoires conditionnels. Pour terminer, nous montrons que la mesure de confiance produite est bien calibrée selon une évaluation en terme d'Entropie Croisée Normalisée.

"Domaine(s)" et indice(s) Dewey

  • Informatique appliquée à la linguistique (410.285)

Thème(s)

Document(s) annexe(s) - Utilisation des représentations continues des mots et des parame?tres prosodiques pour la détection d’erreurs dans les transcriptions automatiques de la parole

Partagez !

AUTEUR(S)

  • Sahar Ghannay
  • Yannick Estève
  • Nathalie Camelin
  • Camille Dutrey
  • Fabian Santiago
  • Martine Adda-Decker

EN SAVOIR PLUS

  • Identifiant de la fiche
    32433
  • Identifiant
    oai:canal-u.fr:32433
  • Schéma de la métadonnée
  • Entrepôt d'origine
    Canal-U