Genetic mutations combinatorics - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2014

Genetic mutations combinatorics

Combinatoire des mutations génétiques

Résumé

In a first part, I show the work I have done on molecular evolution. I present the general biological background and the measures that allow us to detect both conservation and coevolution at the amino-acid level. Then, I present an application of these measures to the detection of critical residues in the cancer protein P53. To this end, I have made a benchmark of different prediction methods. I then use the same methodology on a large scale database of pathogenic mutations linked to genetic diseases. After that, I show how residue-level coevolution can help us discover protein-protein interactions in the hepatitis C virus. Finally, I present the PruneTree algorithm, which allows filtering sequence sets used as input for molecular coevolution detection methods. In a second part, I have studied evolution at the genome level, in particular the recombination mechanisms that occur during meiosis. I have looked at the recombination rates along the genomes and its primary cause, the double-strand breaks, but also at the density of other proteins involved in recombination. I also present a method based on Fourier transforms to analyze these genomic signals, and a model for the distribution along the genome of double-strand breaks and recombination proteins. Finally, I present the other tools I have developed. I describe a novel algorithm that can simulate the evolution of genomes in order to benchmark the phylogenetic reconstruction algorithm PhyChro. Finally, I present the R-CLAG package that allows for easy use of the clustering algorithm CLAG.
Dans une première partie, je présente le travail que j’ai accompli sur la coévolution moléculaire. Je présente le contexte biologique et les différentes mesures qui permettent de détecter la conservation et la coévolution à l’échelle des acides aminés. Ensuite, je montre une application de ces mesures à la détection des résidus critiques dans la protéine P53 liée au cancer. Dans ce but, j’ai créé une évaluation des différentes méthodes de prédiction. J’utilise ensuite la même méthodologie sur une base de données de mutations liées à des maladies génétiques. Je montre également comment la coévolution au niveau des résidus permet de découvrir des interactions protéine-protéine sur le virus de l’hépatite C. Enfin, je présente l’algorithme PruneTree, qui permet de filtrer des ensembles de séquences utilisés comme entrée par les programmes de détection de coévolution.Dans une deuxième partie, je m’intéresse à l’étude de l’évolution à l’échelle du génome, en particulier aux mécanismes de recombinaison méiotique. Pour cela j’ai considéré le taux de recombinaison le long du génome et sa cause, les cassures double-brin de l’ADN. Je présente alors un modèle de la distribution de ces cassures et de la liaison des différentes protéines liées à la recombinaison. Je présente également une méthode de détection de périodicité le long du génome basée sur les transformées de Fourier.Enfin, dans la dernière partie, je présente un nouvel algorithme pour simuler l’évolution des génomes de façon à évaluer les outils de reconstruction, et le paquet R-CLAG permettant d’utiliser l’algorithme de classification CLAG depuis R.
Fichier principal
Vignette du fichier
2014PA066636.pdf (6.78 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-01118660 , version 1 (19-02-2015)
tel-01118660 , version 2 (07-05-2015)

Identifiants

  • HAL Id : tel-01118660 , version 2

Citer

Raphael Champeimont. Genetic mutations combinatorics. Bioinformatics [q-bio.QM]. Université Pierre et Marie Curie - Paris VI, 2014. English. ⟨NNT : 2014PA066636⟩. ⟨tel-01118660v2⟩
310 Consultations
357 Téléchargements

Partager

Gmail Facebook X LinkedIn More