Ressource pédagogique : 06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)

cours / présentation - Date de création : 23-06-2015
Partagez !

Présentation de: 06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)

Informations pratiques sur cette ressource

Langue du document : Français
Type pédagogique : cours / présentation
Niveau : enseignement supérieur
Durée d'exécution : 26 minutes 58 secondes
Contenu : image en mouvement
Document : video/mp4
Taille : 115.77 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource pédagogique

Description (résumé)

Sessions orales TALN 2015 – Mardi 23 juin 2015 Session Classification et Alignement Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire Hai Hieu Vu, Jeanne Villaneau, Farida Saïd et Pierre-François Marteau Résumé : Ce papier présente une méthode pour mesurer la similarité sémantique entre phrases qui utilise Wikipédia comme unique ressource linguistique et qui est, de ce fait, utilisable pour un grand nombre de langues. Basée sur une représentation vectorielle, elle utilise une indexation aléatoire pour réduire la dimension des espaces manipulés. En outre, elle inclut une technique de calcul des vecteurs de termes qui corrige les défauts engendrés par l’utilisation d’un corpus aussi général que Wikipédia. Le système a été évalué sur les données de SemEval 2014 en anglais avec des résultats très encourageants, au-dessus du niveau moyen des systèmes en compétition. Il a également été testé sur un ensemble de paires de phrases en français, à partir de ressources que nous avons construites et qui seront mises à la libre disposition de la communauté scientifique.

"Domaine(s)" et indice(s) Dewey

  • Traduction automatique (418.02)
  • Informatique appliquée à la linguistique (410.285)

Thème(s)

Document(s) annexe(s) - 06c - Mesurer la similarité entre phrases grâce à Wikipédia en utilisant une indexation aléatoire (taln2015)

Partagez !

EN SAVOIR PLUS

  • Identifiant de la fiche
    18678
  • Identifiant
    oai:canal-u.fr:18678
  • Schéma de la métadonnée
  • Entrepôt d'origine
    Canal-U