Modélisation de l'évolution de la taille des génomes et de leur densité en gènes par mutations locales et grands réarrangements chromosomiques - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2013

Modelling of the evolution of genome size and gene den- sity by local mutations and large chromosomal rearran- gements

Modélisation de l'évolution de la taille des génomes et de leur densité en gènes par mutations locales et grands réarrangements chromosomiques

Résumé

Even though numerous genome sequences are now available, evolutionary mechanisms that determine genome size, notably their fraction of non-coding DNA, are still debated. In particular, although several mechanisms responsible for genome growth (proliferation of transposable elements, gene duplication and divergence, etc.) were clearly identified, mechanisms limiting the overall genome size remain unclear. Darwinian selection could directly disadvantage less compact genomes, under the hypothesis that a larger quantity of DNA could slow down the speed of reproduction of the organism. Because this hypothesis was proven wrong by several datasets, non selective mechanisms have been proposed, e.g. genetic drift and/or a mutational bias towards small DNA deletions compared to small DNA insertions. In this manuscript, we use a matrix model to show that genome size can also be limited by the spontaneous dynamics of duplications and large deletions, which tends to decrease genome size even if the two types of rearrangements occur at the same rate. In the absence of Darwinian selection, we prove the existence of a stationary distribution of genome size even if duplications are twice as frequent as large deletions. To test whether selection can overcome this spontaneous dynamics, we simulate our model numerically and choose a fitness function that directly favors genomes containing more genes, while keeping duplica- tions twice as frequent as large deletions. In this scenario where, at first sight, everything seems to favor infinite genome growth, genome size remains nonetheless bounded. As a result, our study reveals a new pressure that could be responsible for limiting genome growth. By illustrating counter-intuitive behaviors in a minimal model, this study also underlines the limits of simple "thought experiments" to understand evolution. We propose a mathematical model of the structural evolution of genomes that focuses on the influence of several mutation mechanisms. It is a matrix model of a population evolving on a discrete time scale in a space encompassing an infinity of possible genome structures. Population size is also infinite, which eliminates genetic drift. Mutations taken into account are point mutations, small insertions and deletions, but also chromosomal rearrangements induced be ectopic recombination of DNA, namely inversions, translo- cations, large deletions and duplications. For simplicity, we suppose that rearrangement sizes are distributed uniformly, but the main analytical result is generalized to other dis- tributions. As the mutations may change the number of genes or the length of intergenic DNA, genomes can vary in size and gene density, which enables us to study the influence of mutation rates on the genome structure obtained at steady-state. In the first part of the thesis, we propose a mathematical analysis in the absence of selec- tion, i.e. when the probability of reproduction does not depend on the genome structure. By using Doeblin's condition, we show that a stationary distribution of genome size exists as soon as the duplication rate per base per generation is lower than 2.58 times the large deletion rate. Indeed, under the hypotheses of the model, these two types of mutations determine the spontaneous dynamics of genome size, while small insertions and small deletions have a limited impact. What is more, even if the sizes of duplications and large deletions are distributed symmetrically, the overall effect on size is in fact not symme- trical, as large deletions have a higher impact than duplications. Thus, if the sizes of duplications and large deletions are distributed uniformly, more than 2.58 duplications are needed, on average, to compensate for a large deletion. In order to achieve infinite growth of genome size, the duplication rate must thus be nearly three times higher than the deletion rate. Under the hypotheses of the model, the impact of deletions is such that the latter result remains true even if a selection mechanism that directly favors retention of new genes is applied. Intuitively, such a selective pressure should lead to infinite growth by accumulation of new genes but, in fact, the influence of large deletions rapidly limits this growth. To sum up, the analytical study predicts that large rearrangements delimit a subspace of stable genome sizes in which genomes can evolve, selection influencing the precise size towards which the population will converge among this subset of stable sizes. In the second part of the thesis, we implement the model numerically in order to simulate the evolution of genome size in the presence of selection. By choosing an unbounded fitness function that strictly increases with the number of genes, we test the behaviour of the model in extreme conditions, pushing genomes to grow indefinitely. However, in these conditions, the numerical model confirms that genomes size is essentially controlled by the duplication and large deletion rates. What is more, this limit applies to the overall genome size, that is to coding as well as non-coding DNA. Simulations display the threshold at 2.58 duplications for one deletions below which genome size remains finite, as predicted analytically. The numerical study shows that, under some conditions, the average genome size shrinks when the duplication rate increases, a surprising phenomenon linked with the structural instability of large genomes. Similarly, increasing the selective advantage of large genomes can lead to an average genome reduction. Finally, we show that, even if small insertions, small deletions, inversions and translocations have a limited impact on genome size, they have an important influence on the fraction of non-coding DNA of the genome.
Bien que de nombreuses séquences génomiques soient maintenant connues, les mécanismes évolutifs qui déterminent la taille des génomes, et notamment leur part d'ADN non codant, sont encore débattus. Ainsi, alors que de nombreux mécanismes faisant grandir les génomes (prolifération d'éléments transposables, création de nouveaux gènes par duplication, ...) sont clairement identifiés, les mécanismes limitant la taille des génomes sont moins bien établis. La sélection darwinienne pourrait directement défavoriser les génomes les moins compacts, sous l'hypothèse qu'une grande quantité d'ADN à répliquer limite la vitesse de reproduction de l'organisme. Cette hypothèse étant cependant contredite par plusieurs jeux de données, d'autres mécanismes non sélectifs ont été proposés, comme la dérive génétique et/ou un biais mutationnel rendant les petites délétions d'ADN plus fréquentes que les petites insertions. Dans ce manuscrit, nous montrons à l'aide d'un modèle matriciel de population que la taille du génome peut aussi être limitée par la dynamique spontanée des duplications et des grandes délétions, qui tend à raccourcir les génomes même si les deux types de ré- arrangements se produisent à la même fréquence. En l'absence de sélection darwinienne, nous prouvons l'existence d'une distribution stationnaire pour la taille du génome même si les duplications sont deux fois plus fréquentes que les délétions. Pour tester si la sélection darwinienne peut contrecarrer cette dynamique spontanée, nous simulons numériquement le modèle en choisissant une fonction de fitness qui favorise directement les génomes conte- nant le plus de gènes, tout en conservant des duplications deux fois plus fréquentes que les délétions. Dans ce scénario où tout semblait pousser les génomes à grandir infiniment, la taille du génome reste pourtant bornée. Ainsi, notre étude révèle une nouvelle force susceptible de limiter la croissance des génomes. En mettant en évidence des comporte- ments contre-intuitifs dans un modèle pourtant minimaliste, cette étude souligne aussi les limites de la simple " expérience de pensée " pour penser l'évolution. Nous proposons un modèle mathématique de l'évolution structurelle des génomes en met- tant l'accent sur l'influence des différents mécanismes de mutation. Il s'agit d'un modèle matriciel de population, à temps discret, avec un nombre infini d'états génomiques pos- sibles. La taille de population est infinie, ce qui élimine le phénomène de dérive génétique. Les mutations prises en compte sont les mutations ponctuelles, les petites insertions et délétions, mais aussi les réarrangements chromosomiques induits par la recombinaison ectopique de l'ADN, comme les inversions, les translocations, les grandes délétions et les duplications. Nous supposons par commodité que la taille des segments réarrangés suit une loi uniforme, mais le principal résultat analytique est ensuite généralisé à d'autres dis- tributions. Les mutations étant susceptibles de changer le nombre de gènes et la quantité d'ADN intergénique, le génome est libre de varier en taille et en compacité, ce qui nous permet d'étudier l'influence des taux de mutation sur la structure génomique à l'équilibre. Dans la première partie de la thèse, nous proposons une analyse mathématique dans le cas où il n'y a pas de sélection, c'est-à-dire lorsque la probabilité de reproduction est identique quelle que soit la structure du génome. En utilisant le théorème de Doeblin, nous montrons qu'une distribution stationnaire existe pour la taille du génome si le taux de duplications par base et par génération n'excède pas 2.58 fois le taux de grandes délétions. En effet, sous les hypothèses du modèle, ces deux types de mutation déterminent la dynamique spontanée du génome, alors que les petites insertions et petites délétions n'ont que très peu d'impact. De plus, même si les tailles des duplications et des grandes délétions sont distribuées de façon parfaitement symétriques, leur effet conjoint n'est, lui, pas symétrique et les délétions l'emportent sur les duplications. Ainsi, si les tailles de délétions et de duplications sont distribuées uniformément, il faut, en moyenne, plus de 2.58 duplications pour compenser une grande délétion. Il faut donc que le taux de duplications soit quasiment trois fois supérieur au taux de délétions pour que la taille des génomes croisse à l'infini. L'impact des grandes délétions est tel que, sous les hypothèses du modèle, ce dernier résultat reste valide même en présence d'un mécanisme de sélection favorisant directement l'ajout de nouveaux gènes. Même si un tel mécanisme sélectif devrait intuitivement pousser les génomes à grandir infiniment, en réalité, l'influence des délétions va rapidement limiter leur accroissement. En résumé, l'étude analytique prédit que les grands réarrangements délimitent un ensemble de tailles stables dans lesquelles les génomes peuvent évoluer, la sélection influençant la taille précise à l'équilibre parmi cet ensemble de tailles stables. Dans la deuxième partie de la thèse, nous implémentons le modèle numériquement afin de pouvoir simuler l'évolution de la taille du génome en présence de sélection. En choisissant une fonction de fitness non bornée et strictement croissante avec le nombre de gènes dans le génome, nous testons le comportement du modèle dans des conditions extrêmes, poussant les génomes à croître indéfiniment. Pourtant, dans ces conditions, le modèle numérique confirme que la taille des génomes est essentiellement contrôlée par les taux de duplications et de grandes délétions. De plus, cette limite concerne la taille totale du génome et s'applique donc aussi bien au codant qu'au non codant. Nous retrouvons en particulier le seuil de 2.58 duplications pour une délétion en deçà duquel la taille des génomes reste finie, comme prévu analytiquement. Le modèle numérique montre même que, dans certaines conditions, la taille moyenne des génomes diminue lorsque le taux de duplications augmente, un phénomène surprenant lié à l'instabilité structurelle des grands génomes. De façon similaire, augmenter l'avantage sélectif des grands génomes peut paradoxalement faire rétrécir les génomes en moyenne. Enfin, nous montrons que si les petites insertions et délétions, les inversions et les translocations ont un effet limité sur la taille du génome, ils influencent très largement la proportion d'ADN non codant.
Fichier principal
Vignette du fichier
these.pdf (2.45 Mo) Télécharger le fichier

Dates et versions

tel-00924831 , version 1 (07-01-2014)
tel-00924831 , version 2 (27-10-2014)

Identifiants

  • HAL Id : tel-00924831 , version 1

Citer

Stephan Fischer. Modélisation de l'évolution de la taille des génomes et de leur densité en gènes par mutations locales et grands réarrangements chromosomiques. Evolution [q-bio.PE]. INSA de Lyon, 2013. Français. ⟨NNT : ⟩. ⟨tel-00924831v1⟩
822 Consultations
2336 Téléchargements

Partager

Gmail Facebook X LinkedIn More