Ressource pédagogique : EMOIS Nancy 2011 - Codage automatisé : ontologie médicale construite par fouille de textes.

cours / présentation - Date de création : 18-03-2011
Auteur(s) : Grégoire FICHEUR
Partagez !

Présentation de: EMOIS Nancy 2011 - Codage automatisé : ontologie médicale construite par fouille de textes.

Informations pratiques sur cette ressource

Langue du document : Français
Type pédagogique : cours / présentation
Niveau : enseignement supérieur, formation continue, enseignement supérieur, enseignement supérieur
Durée d'exécution : 20 minutes 20 secondes
Contenu : image en mouvement
Document : video/mp4
Taille : 87.01 Mo
Droits d'auteur : libre de droits, gratuit
Droits réservés à l'éditeur et aux auteurs.

Description de la ressource pédagogique

Description (résumé)

Titre : Codage automatisé : proposition d’une méthode utilisant une ontologie médicale construite par fouille de textes. Résumé : Le codage automatisé est devenu un enjeu médico-économique majeur. Deux étapes clés peuvent être individualisées parmi les méthodes proposées dans la littérature : une première consiste à fabriquer une terminologie médicale, une seconde à construire une ontologie agrégeant ces termes en concepts par la formalisation de liens logiques. Chacune de ces étapes peut être réalisée à dire d’expert et/ou par fouille de textes. Nous proposons une méthode entièrement automatisée pour réaliser ces deux étapes, l’ontologie finalement obtenue devant permettre de formaliser une relation simple entre des expressions et le codage selon la 10è Classification Internationale des Maladies (CIM-10). Méthodes : Nous utilisons des courriers hospitaliers en français (texte libre) issus de 8610 séjours pour lesquels nous disposons également du codage des diagnostics selon la CIM-10. Nous retenons 201 codes différents (codes présents plus de 30 fois). Tout d’abord, nous construisons une terminologie médicale par la recherche de motifs séquentiels au sein des courriers puis un filtre est appliqué. Ensuite nous réalisons, pour chaque code, une étape de sélection des expressions clés par fouille statistique de données. Nous fixons deux seuils de significativité permettant d’identifier d’une part les synonymes du libellé du code décrit et d’autre part les expressions appartenant à la symptomatologie de la pathologie ainsi codée. Résultats : Nous obtenons une terminologie comprenant plus de 60 000 expressions médicales. L’étape de fouille statistique de données associe à chaque code 14 synonymes et 45 symptômes (valeurs médianes). Nous disposons notamment des variants orthographiques couramment utilisés dans les courriers hospitaliers. Discussion/Conclusion : L’ontologie ainsi obtenue et son intérêt dans la construction de règles de prédiction du codage sont évaluées. La généralisation à davantage de diagnostics requiert l’utilisation d’un nombre plus élevé de séjours hospitaliers. Notre méthode n’est dépendante ni de la langue ni de la classification utilisées. Intervenant : FICHEUR Grégoire (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France). Conférence enregistrée lors des journées EMOIS 2011 à Nancy. Session : systèmes d’informations. Modérateurs : Régis BEUSCART (CHRU de Lille, service d’information et des archives médicales, EA2694, Lille, France) , Sandra GOMEZ (ATIH - Lyon). Réalisation, production : Canalu U/3S, CERIMES. SCD Médecine.

"Domaine(s)" et indice(s) Dewey

  • Traitement des données. Informatique (004)
  • Statistiques (310)
  • Sciences médicales. Médecine (610)

Thème(s)

Intervenants, édition et diffusion

Intervenants

Fournisseur(s) de contenus : Canal-U/Sciences de la Santé et du Sport, CERIMES

Diffusion

Document(s) annexe(s) - EMOIS Nancy 2011 - Codage automatisé : ontologie médicale construite par fouille de textes.

Partagez !

AUTEUR(S)

  • Grégoire FICHEUR

EN SAVOIR PLUS

  • Identifiant de la fiche
    6820
  • Identifiant
    oai:canal-u.fr:6820
  • Schéma de la métadonnée
  • Entrepôt d'origine
    Canal-U