Ressource pédagogique : 10b - …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux (taln2015)

cours / présentation - Date de création : 23-06-2015
Partagez !

Présentation de: 10b - …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux (taln2015)

Informations pratiques sur cette ressource

Langue du document : Français
Type pédagogique : cours / présentation
Niveau : enseignement supérieur
Durée d'exécution : 28 minutes 34 secondes
Contenu : image en mouvement
Document : video/mp4
Taille : 122.02 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource pédagogique

Description (résumé)

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Plénière …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux Natalia Grabar et Iris Eshkol Résumé : Notre travail porte sur la détection automatique des segments en relation de reformulation paraphrastique dans les corpus oraux. L’approche proposée est une approche syntagmatique qui tient compte des marqueurs de reformulation paraphrastique et des spécificités de l’oral. Les données de référence sont consensuelles. Une méthode automatique fondée sur l’apprentissage avec les CRF est proposée afin de détecter les segments paraphrasés. Différents descripteurs sont exploités dans une fenêtre de taille variable. Les tests effectués montrent que les segments en relation de paraphrase sont assez difficiles à détecter, surtout avec leurs frontières correctes. Les meilleures moyennes atteignent 0,65 de F-mesure, 0,75 de précision et 0,63 de rappel. Nous avons plusieurs perspectives à ce travail pour améliorer la détection des segments en relation de paraphrase et pour étudier les données d’autres points de vue.

"Domaine(s)" et indice(s) Dewey

  • Traduction automatique (418.02)
  • Informatique appliquée à la linguistique (410.285)

Thème(s)

Document(s) annexe(s) - 10b - …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux (taln2015)

Partagez !

EN SAVOIR PLUS

  • Identifiant de la fiche
    18705
  • Identifiant
    oai:canal-u.fr:18705
  • Schéma de la métadonnée
  • Entrepôt d'origine
    Canal-U