Ressource pédagogique : Auto-encodeurs pour la compréhension de documents parlés
Présentation de: Auto-encodeurs pour la compréhension de documents parlés
Informations pratiques sur cette ressource
Droits réservés à l'éditeur et aux auteurs.
Description de la ressource pédagogique
Description (résumé)
JEP-TALN-RECITAL 2016 - Mercredi 6 juillet 2016 Session commune JEP/TALN 1 Auto-encodeurs pour la compréhension de documents parlés Killian Janod, Mohamed Morchid, Richard Dufour, Georges Linarès and Renato De Mori Résumé : Les représentations de documents au moyen d'approches à base de réseaux de neurones ont montré des améliorations significatives dans de nombreuses tâches du traitement du langage naturel. Dans le cadre d'applications réelles, où des conditions d'enregistrement difficiles peuvent être rencontrées, la transcription automatique de documents parlés peut générer un nombre de mots mal transcrits important. Cet article propose une représentation des documents parlés très bruités utilisant des caractéristiques apprises par un auto-encodeur profond supervisé. La méthode proposée s'appuie à la fois sur les documents bruités et leur équivalent propre annoté manuellement pour estimer une représentation plus robuste des documents bruités. Cette représentation est évaluée sur le corpus DECODA sur une tâche de classification thématique de conversations téléphoniques atteignant une précision de 83% avec un gain d'environ 6%.
"Domaine(s)" et indice(s) Dewey
- Informatique appliquée à la linguistique (410.285)
Thème(s)
Document(s) annexe(s) - Auto-encodeurs pour la compréhension de documents parlés
- Cette ressource fait partie de
AUTEUR(S)
-
Killian Janod
-
Mohamed Morchid
-
Richard Dufour
-
Serge LINARES
-
Renato De Mori
EN SAVOIR PLUS
-
Identifiant de la fiche
32405 -
Identifiant
oai:canal-u.fr:32405 -
Schéma de la métadonnée
- LOMv1.0
- LOMFRv1.0
- Voir la fiche XML
-
Entrepôt d'origine