Ressource pédagogique : 10b - …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux (taln2015)
Présentation de: 10b - …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux (taln2015)
Informations pratiques sur cette ressource
Droits réservés à l'éditeur et aux auteurs.
Description de la ressource pédagogique
Description (résumé)
Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Plénière …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux Natalia Grabar et Iris Eshkol Résumé : Notre travail porte sur la détection automatique des segments en relation de reformulation paraphrastique dans les corpus oraux. L’approche proposée est une approche syntagmatique qui tient compte des marqueurs de reformulation paraphrastique et des spécificités de l’oral. Les données de référence sont consensuelles. Une méthode automatique fondée sur l’apprentissage avec les CRF est proposée afin de détecter les segments paraphrasés. Différents descripteurs sont exploités dans une fenêtre de taille variable. Les tests effectués montrent que les segments en relation de paraphrase sont assez difficiles à détecter, surtout avec leurs frontières correctes. Les meilleures moyennes atteignent 0,65 de F-mesure, 0,75 de précision et 0,63 de rappel. Nous avons plusieurs perspectives à ce travail pour améliorer la détection des segments en relation de paraphrase et pour étudier les données d’autres points de vue.
"Domaine(s)" et indice(s) Dewey
- Traduction automatique (418.02)
- Informatique appliquée à la linguistique (410.285)
Thème(s)
Document(s) annexe(s) - 10b - …des conférences enfin disons des causeries… Détection automatique de segments en relation de paraphrase dans les reformulations de corpus oraux (taln2015)
- Cette ressource fait partie de
EN SAVOIR PLUS
-
Identifiant de la fiche
18705 -
Identifiant
oai:canal-u.fr:18705 -
Schéma de la métadonnée
- LOMv1.0
- LOMFRv1.0
- Voir la fiche XML
-
Entrepôt d'origine