Ressource pédagogique : 3.7. Index et arbre des suffixes
Présentation de: 3.7. Index et arbre des suffixes
Informations pratiques sur cette ressource
Droits réservés à l'éditeur et aux auteurs. Ces ressources de cours sont, sauf mention contraire, diffusées sous Licence Creative Commons. L’utilisateur doit mentionner le nom de l’auteur, il peut exploiter l’œuvre sauf dans un contexte commercial et il ne peut apporter de modifications à l’œuvre originale.
Description de la ressource pédagogique
Description (résumé)
Il y a donc deux approches pour améliorer la performance des algorithmes de recherche d'un motif dans une chaîne de caractères. La première approche consiste à pré-traiter le motif. On a vu un exemple de cette approche avec l'algorithme de Boyer-Moore. La deuxième approche consiste à pré-traiter le texte dans lequel nous recherchons les motifs. Et nous allons voir deux exemples de mise en oeuvre de cette approche. La première consiste à construire un index de mots de longueur fixe. De quoi s'agit-il ? Considérons cette chaîne de caractères, relativement courte ici, de longueur 14. Nous allons construire un index de tous les triplets qui apparaissent dans cette séquence. Voilà ce que ça donne. Vérifions. Ce triplet AA # ou # n'appartient pas à la séquence mais marque la fin de la séquence. On trouve bien une occurrence de ce triplet à la position 13. De même pour le triplet ACG, on trouve bien une occurrence, voire même l'occurrence, la seule de ACG à la position une, et ainsi de suite...
"Domaine(s)" et indice(s) Dewey
- biologie application informatique (570.285)
Thème(s)
Document(s) annexe(s) - 3.7. Index et arbre des suffixes
- Cette ressource fait partie de
AUTEUR(S)
-
Francois RECHENMANN
-
Thierry PARMENTELAT
EN SAVOIR PLUS
-
Identifiant de la fiche
24586 -
Identifiant
oai:canal-u.fr:24586 -
Schéma de la métadonnée
- LOMv1.0
- LOMFRv1.0
- Voir la fiche XML
-
Entrepôt d'origine