Heuristiques pour la résolution du problème d'alignement multiple - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Heuristics for the multiple alignment problem

Heuristiques pour la résolution du problème d'alignement multiple

Résumé

Multiple alignment is one of the basic and central tasks in Bioinformatics which tries to higlight similarities between sequences. It is a prior to phylogeny reconstruction, pattern matching and protein structure prediction. This thesis aims to develop new algorithms to tackle this problem, and it introduces two new progressive algorithms that align alignments instead of profiles.
The first algorithm, Plasma I, uses a descent where each iteration consists in gap insertions in one of the two multiple alignments. The second algorithm, Plasma II is based on the Dynamic Programming principle. We propose with this algorithm a generalization of the pairwise sequence alignment algorithm, and we extend the Dynamic Programming framework to align two multiple alignments. The performances of Plasma II are assessed on the well-known Balibase benchmarks, and compared with several algorithms. Plasma II provides results of quality with fast computation time.
L'alignement multiple est une opération permettant de mettre en évidence la similarité entre plusieurs séquences. Il est notamment utilisé pour la reconstruction de phylogénies, la recherche de motifs et la prédiction de structures. Cette thèse s'intéresse au développement de nouveaux algorithmes pour ce problème particulièrement difficile, et introduit deux algorithmes progressifs ayant pour point commun de réaliser un alignement multiple par alignements successifs de groupes de séquences.
Le premier algorithme, Plasma utilise une méthode de descente, dont chaque itération consiste à réaliser des insertions de colonnes de brèches dans deux alignements multiples à aligner. Le second algorithme, Plasma II , est basé sur le principe de la programmation dynamique. Nous généralisons ici l'algorithme utilisé pour l'alignement de deux séquences, et étendons le cadre de la programmation dynamique `a l'alignement de deux alignements multiples. Cet algorithme ainsi que plusieurs variantes sont intensivement évalués sur les jeux d'essais de Balibase, montrant des résultats encourageants, voire compétitifs, par rapport à certains algorithmes de référence comme Clustal W, tant sur la qualité de l'alignement que sur le temps de calcul.
Fichier principal
Vignette du fichier
main.pdf (954.44 Ko) Télécharger le fichier
Loading...

Dates et versions

tel-00352784 , version 1 (13-01-2009)

Identifiants

  • HAL Id : tel-00352784 , version 1

Citer

Vincent Derrien. Heuristiques pour la résolution du problème d'alignement multiple. Informatique [cs]. Université d'Angers, 2008. Français. ⟨NNT : ⟩. ⟨tel-00352784⟩
285 Consultations
2132 Téléchargements

Partager

Gmail Facebook X LinkedIn More