Méthodes de distance pour l'inférence phylogénomique - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

Distance-based methods for phylogenomics

Méthodes de distance pour l'inférence phylogénomique

Résumé

L'inférence phylogénomique cherche à combiner le signal évolutif induit par un ensemble de gènes dans le but de construire un unique arbre phylogénétique.
Elle peut être décomposée en trois grandes familles méthodologiques: la combinaison basse, qui s'appuie sur la concaténation des différents gènes, la combinaison haute, qui considère l'ensemble des arbres inférés à partir de chaque gène, et la combinaison moyenne, qui encode les différents signaux phylogénétiques puis combine ces différents encodages.
Une méthode d'inférence d'arbre est ensuite appliquée sur le résultat de la combinaison.

Cette thèse développe de nouveaux scénarios d'inférence phylogénomique, principalement basés sur l'estimation de distances évolutives entre chaque paire de taxons.
Elle propose une nouvelle méthode de combinaison moyenne, nommée SDM, qui considère les matrices de distance estimées à partir de chaque gène et qui les combine en une unique supermatrice de distance.
Cette dernière pouvant parfois contenir des distances manquantes, cette thèse décrit également de nouveaux algorithmes, nommés NJ*, UNJ*, BioNJ* et MVR*, permettant d'inférer très rapidement un arbre à partir d'une matrice de distance complète ou incomplète.
De nombreuses simulations ont permis d'observer les bonnes performances de ces nouvelles méthodes de distance.
Initialement développées pour la combinaison moyenne, elles permettent toutefois d'améliorer significativement les résultats de certaines approches standards en combinaison basse, et représentent une alternative efficace à MRP, la plus utilisée des techniques de combinaison haute, en termes de fiabilité et de rapidité.
La taille des jeux de données phylogénomiques étant de plus en plus importante, les méthodes développées dans cette thèse constituent ainsi des outils de choix pour construire l'Arbre de la Vie.
Fichier principal
Vignette du fichier
memoire.pdf (1.41 Mo) Télécharger le fichier

Dates et versions

tel-00142222 , version 1 (17-04-2007)

Identifiants

  • HAL Id : tel-00142222 , version 1

Citer

Alexis Criscuolo. Méthodes de distance pour l'inférence phylogénomique. Autre [cs.OH]. Université Montpellier II - Sciences et Techniques du Languedoc, 2006. Français. ⟨NNT : ⟩. ⟨tel-00142222⟩
417 Consultations
1709 Téléchargements

Partager

Gmail Facebook X LinkedIn More