Impact des violations des modèles d'annotation et d'évolution de séquences en phylogénomique : application à l'étude des eucaryotes photosynthétiques - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2019

Impact of annotation ans sequence evolution model on phylogenomics : application to the study of photosynthetic eukaryotes

Impact des violations des modèles d'annotation et d'évolution de séquences en phylogénomique : application à l'étude des eucaryotes photosynthétiques

Résumé

Oxygen has shaped life on Earth. Enriching its gaseous form in water then in the atmosphere has allowed the development of multicellular and terrestrial life leading to current biodiversity. This could have taken place thanks to the implementation of the process of the oxidative photosynthesis in living organisms. The latter first appeared in bacteria before being subtilized by nucleated life forms. This action was realized by enslaving the bacterium and keeping it inside the nucleated organism by a phenomenon called endosymbiosis. Different endosymbioses have occurred in history, attributing the ability of photosynthesis to a wide panel of living beings. The aim of this thesis is to study the transmission of photosynthesis in eukaryotic organisms. These present a great diversity of chloroplast, the organelle performing photosynthesis and witnessing the integration of a foreign organism. The inference of phylogeny, i.e. the estimation of the relationship existing between organisms, reveals discrepancies between the story told by the genome of chloroplasts and nuclei. Obtaining these phylogenies and studying their discordances are at the heart of the understanding of the history of the acquisition of photosynthesis. However, the inference of phylogeny is a complex process influenced by the type and the quality of data as well as by the used technology. The considerations of this thesis manuscript focus on the impact of these elements on the resolution of the tree eukaryotes, with the objectif of getting a better understanding of the history of the hosts photosynthetic and their endosymbiont. First, we developed softwares that improve the quality of physical inferences by the removal of segments of sequences determined to be non-relative to the organisms evolution. We demonstrate the effectiveness of the method and its comparative impact to other commonly used sequence filtering methods. Secondly, we create a phylogenomic data set to infer the phylogeny of eukaryotes. This is done semi-automatically and aims to increase the maximum of phylogenetic signal while avoiding the integration of sequences with no trace of homology between organisms. We get a tree of eukaryotes including the greatest diversity of organisms to date and discuss the impact of taxon sampling on the support given to tree topology. Recently, we have studied the impact of the choice of the sequence evolution model on the congruence of the phylogenies obtained between the genomes of the different compartments present in photosynthetic stramenopiles. Our results are in favor of the presence of a weak phylogenetic signal to solve the nodes at the base of this group, the latter can easily be overcome by the non-phylogenetic signal produced by model violations. In the end, this thesis highlights the importance of the development of bioinformatics phylogeny-related method to confidently answer questions in evolution related to old events.
L'oxygène a façonné la vie sur Terre. L'enrichissement de sa forme gazeuse dans l'eau puis dans l'atmosphère a permis le développement de la vie multicellulaire et terrestre menant à la biodiversité actuelle. Celui-ci a pu avoir lieu grâce la mise en place du processus de la photosynthèse oxydative chez les organismes vivants. Ce dernier est d'abord apparu chez les bactérie avant d'être subtilisé par les formes de vie nucléées. Cette action s'est réalisé en asservissant la bactérie et en la maintenant à l'intérieur de l'organisme nucléé par un phénomène nommé endosymbiose. Différentes endosymbioses ont eu lieu dans l'histoire des organismes photosynthétiques, attribuant la capacité de photosynthèse à un large panel d'êtres vivants. L'objectif de cette thèse est d'étudier la transmission de la photosynthèse chez les organismes eucaryotes. Ces derniers présentent une grande diversité de chloroplaste, l'organite réalisant la photosynthèse et témoin de l'intégration d'un organisme étranger à l'intérieur de leur cellule. L'inférence de la phylogénie, i.e. l'estimation des relations de parentés entre les organismes, révèle des discordances entre l'histoire racontée par le génome des chloroplastes et des noyaux. L'obtention de ces phylogénies et l'étude de leurs discordances sont au coeur de la compréhension de l'historique de l'acquisition de la photosynthèse. Cependant, l'inférence de la phylogénie est un procédé complexe influencé par la nature et la qualité des données ainsi que par les techniques employées. Les considérations de ce manuscrit de thèse se focalise sur l'impact de ces éléments sur la résolution de l'arbre des eucaryotes, avec pour objectif une meilleure compréhension de l'histoire des hôtes photosynthétiques et de leur endosymbionte. Premièrement, nous avons développé un logiciel améliorant la qualité des inférences phylogénétiques par le retrait de segments de séquences déterminés comme non relatif à l'évolution des organismes. Nous démontrons l'efficacité de la méthode et son impact comparé aux autres méthodes de filtrage de séquence couramment employées. Secondairement, nous créons un jeu de données phylogénomique en vue d'inférer la phylogénie des eucaryotes. Celui-ci est réalisé de manière semi-automatique et vise à augmenter au maximum le signal phylogénétique tout en évitant l'intégration de séquences ne permettant pas de retracer les liens de parentés entre organisme. Nous obtenons un arbre des eucaryotes comprenant la plus grande diversité en organismes à ce jour et discutons l'impact de l'échantillonnage sur les soutiens apportés à la topologie de l'arbre. Dernièrement, nous avons étudié l'impact du choix du modèle d'évolution des séquences sur la congruence des phylogénies obtenues entre les génomes des différents compartiments présents chez les stramenopiles photosynthétiques. Nos résultats sont en faveur de la présence d'un faible signal phylogénétique pour résoudre les noeuds à la base de ce groupe, ce dernier pouvant être facilement dépassé par le signal non phylogénétique produits par les violations de modèles. Au final, cette thèse met en évidence l'importance du développement des méthodes bioinformatique liées à la phylogénie afin de répondre avec assurance aux questions évolutives relatifs à des événements anciens.
Fichier principal
Vignette du fichier
2019TOU30088b.pdf (6.24 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-02893781 , version 1 (08-07-2020)

Identifiants

  • HAL Id : tel-02893781 , version 1

Citer

Arnaud Di Franco. Impact des violations des modèles d'annotation et d'évolution de séquences en phylogénomique : application à l'étude des eucaryotes photosynthétiques. Biodiversité et Ecologie. Université Paul Sabatier - Toulouse III, 2019. Français. ⟨NNT : 2019TOU30088⟩. ⟨tel-02893781⟩

Collections

STAR
73 Consultations
220 Téléchargements

Partager

Gmail Facebook X LinkedIn More