Skip to Main content Skip to Navigation
Theses

Méthodes de distance pour l'inférence phylogénomique

Résumé : L'inférence phylogénomique cherche à combiner le signal évolutif induit par un ensemble de gènes dans le but de construire un unique arbre phylogénétique.
Elle peut être décomposée en trois grandes familles méthodologiques: la combinaison basse, qui s'appuie sur la concaténation des différents gènes, la combinaison haute, qui considère l'ensemble des arbres inférés à partir de chaque gène, et la combinaison moyenne, qui encode les différents signaux phylogénétiques puis combine ces différents encodages.
Une méthode d'inférence d'arbre est ensuite appliquée sur le résultat de la combinaison.

Cette thèse développe de nouveaux scénarios d'inférence phylogénomique, principalement basés sur l'estimation de distances évolutives entre chaque paire de taxons.
Elle propose une nouvelle méthode de combinaison moyenne, nommée SDM, qui considère les matrices de distance estimées à partir de chaque gène et qui les combine en une unique supermatrice de distance.
Cette dernière pouvant parfois contenir des distances manquantes, cette thèse décrit également de nouveaux algorithmes, nommés NJ*, UNJ*, BioNJ* et MVR*, permettant d'inférer très rapidement un arbre à partir d'une matrice de distance complète ou incomplète.
De nombreuses simulations ont permis d'observer les bonnes performances de ces nouvelles méthodes de distance.
Initialement développées pour la combinaison moyenne, elles permettent toutefois d'améliorer significativement les résultats de certaines approches standards en combinaison basse, et représentent une alternative efficace à MRP, la plus utilisée des techniques de combinaison haute, en termes de fiabilité et de rapidité.
La taille des jeux de données phylogénomiques étant de plus en plus importante, les méthodes développées dans cette thèse constituent ainsi des outils de choix pour construire l'Arbre de la Vie.
Complete list of metadatas

https://tel.archives-ouvertes.fr/tel-00142222
Contributor : Alexis Criscuolo <>
Submitted on : Tuesday, April 17, 2007 - 7:13:55 PM
Last modification on : Monday, October 12, 2020 - 10:58:37 AM
Long-term archiving on: : Wednesday, April 7, 2010 - 12:02:04 AM

Identifiers

  • HAL Id : tel-00142222, version 1

Collections

Citation

Alexis Criscuolo. Méthodes de distance pour l'inférence phylogénomique. Autre [cs.OH]. Université Montpellier II - Sciences et Techniques du Languedoc, 2006. Français. ⟨tel-00142222⟩

Share

Metrics

Record views

552

Files downloads

1293