2411 articles – 24 Notices  [english version]
Fiche détaillée Thèses
Université Joseph-Fourier - Grenoble I (2010-07-09), Didier Piau (Dir.)
Liste des fichiers attachés à ce document : 
PDF
MFthesisv2.pdf(1.7 MB)
ANNEX
soutenance.pdf(722.2 KB)
Sur deux problèmes mathématiques de reconstruction phylogénétique
Mikael Falconnet1

Ce travail de thèse traite de deux problèmes liés aux méthodes de reconstruction d'arbres phylogénétiques. Dans une première partie, nous fournissons des estimateurs consistants ainsi que des intervalles de confiance asymptotiques mathématiquement rigoureux pour le temps d'évolution de séquences d'ADN dans des modèles de substitutions plus réalistes que les modèles usuels, prenant en compte les effets de la méthylation des dinucléotides CpG dans le génome des mammifères. Dans une seconde partie, nous étendons un résultat récent de Steel et Matsen en prouvant qu'un des travers bien connu des méthodes Bayésiennes en phylogénie, appelé "star tree paradox", a en fait lieu dans un cadre plus large que celui de Steel et Matsen.
1 :  IF - Institut Fourier
Processus de Markov – intervalles de confiance – séquences d'ADN – distances phylogénétiques – déficit en CpG – arbres phylogénétiques – statistiques bayésiennes – arbres en étoile.

About two problems of phylogeny reconstruction
In this thesis, we deal with two problems of phylogeny reconstruction. First, we consider models of nucleotidic substitution processes where the rate of substitution at a given site depends on the state of the neighbours of the site. We estimate the time elapsed between an ancestral sequence at stationarity and a present sequence. Then, assuming that two sequences are issued from a common ancestral sequence at stationarity, we estimate the time since divergence. In the simplest nontrivial case of a Jukes-Cantor model with CpG influence, we provide and justify mathematically consistent estimators in these two settings. We also provide asymptotic confidence intervals, valid for nucleotidic sequences of finite length, and we compute explicit formulas for the estimators and for their confidence intervals. In the general case of an RN model with YpR influence, we extend these results under a proviso, namely that the equation defining the estimator has a unique solution. Second, we show that the Bayesian star paradox, first proved mathematically by Steel and Matsen for a specific class of prior distribution, occurs in a wider context.
Keywords. Markov processes – confidence intervals – DNA sequences – phylogenetic distances – CpG deficiency – phylogenetic trees – Bayesian statistics – star trees.