Investigating the impact of repetitive DNA on genome dynamics : Towards a focus on mosquito genomes - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2021

Investigating the impact of repetitive DNA on genome dynamics : Towards a focus on mosquito genomes

Étude de l'impact des répétitions d'ADN sur la dynamique des génomes : Vers un focus sur les génomes de moustiques

Résumé

Genomic variation is induced by numerous factors simultaneously, which results in a set of genomic behaviours related to its structure, architecture, expression, evolution, etc, which could be referred to as genome dynamics. During my thesis project, we chose to focus on three major players impacting genome dynamics:- Chromatin structure: unevenly compacted along chromosomes;- Meiotic recombination landscape: reflecting the frequency variations of exchanging DNA fragments during cell division;- Repetitive DNA: mainly Transposable Elements (TEs) inducing genome assembly errors.Firstly, We propose an automated computational tool, based on the Marey maps method, allowing to identify heterochromatin boundaries along chromosomes and estimating local recombination rates. Our method, called BREC (heterochromatin Boundaries and RECombination rate estimates) is non-genome-specific, running even on non-model genomes as long as genetic and physical maps are available. BREC is a statistic-based data-driven tool. Therefore, a data pre-processing module (data quality control and cleaning) is provided. BREC results would allow conducting more broadly an analysis with a comparative genomics approach on their identified heterochromatin regions in terms of recombination landscape, TE density, etc.Secondly, in order to address the genome assembly process which is strongly impacted by the TE abundance, one type of repeats, we chose to focus on the scaffolding step with the aim of enhancing the assembly quality by exploiting the analysis of repeated regions and proposing a pipeline of improvement.Thirdly, with the aim of testing the veracity of the approaches and tools developed but also to return to the analysis of mosquito genomes, we present a case study combining the application results on the variations in recombination rate along these genomes, as well as and the organization of chromatin domains, with respect to the TE distribution along each chromosome. The preliminary findings suggest a correlation between the distribution of certain TE families and the chromatin domains.To conclude this thesis manuscript, we present an opening concerning genomes dynamics with respect to the different aspects addressed. Then, we present the conceptual, application, and technical limits identified by our experimental design. Finally, we suggest a few perspectives on the scope of our contributions beyond my PhD project.
Les variations du génome sont induites par de nombreux facteurs simultanés, ce qui se traduit par un ensemble de comportements génomiques liés à sa structure, son architecture, son expression, son évolution, etc., que l'on pourrait appeler la dynamique du génome. Au cours de mon projet de thèse, nous avons choisi de nous concentrer sur trois acteurs majeurs impactant la dynamique du génome :- Structure de la chromatine : inégalement compactée le long des chromosomes ;- Paysage de la recombinaison méiotique : reflétant les variations de fréquences d'échange de fragments d'ADN lors de la division cellulaire ;- ADN répétitif : notamment les éléments transposables (ET) induisant des erreurs d'assemblage du génome.En premier lieu, nous proposons un outil de calcul automatisé, basé sur la méthode des cartes de Marey, permettant d'identifier les limites d'hétérochromatine le long des chromosomes et d'estimer les taux de recombinaison locale. Notre méthode, appelée BREC (heterochromatin Boundaries and RECombination rate estimates) n'est pas spécifique au génome, et s'exécute même sur des génomes non modèles tant que des cartes génétiques et physiques sont disponibles. BREC est basé sur des statistiques et axé sur les données, ce qui implique qu'une bonne qualité des données d'entrée reste une exigence forte. Par conséquent, un module de pré-traitement des données (contrôle et nettoyage de la qualité des données) est fourni. Les résultats de BREC permettent de mener une approche de génomique comparative sur les régions hétérochromatiques identifiées en terme de paysage de recombinaison, de densité de ET, etc.En second lieu, afin d'aborder le processus d'assemblage du génome qui est fortement impacté par l'abondance des ET, nous avons choisi de nous concentrer sur l'étape d'échafaudage et d'améliorer la qualité de l'assemblage en exploitant l'analyse des régions répétées sous la forme d'un pipeline.En troisième lieu, dans le but de tester la véracité des approches et des outils développés, mais aussi de revenir sur l'analyse des génomes de moustiques, nous présentons une étude de cas combinant les résultats d'application sur les variations de taux de recombinaison le long de ces génomes, ainsi que l'organisation des domaines de la chromatine, par rapport à la distribution d'ET le long de chaque chromosome. Les résultats préliminaires suggèrent une corrélation entre la distribution de certaines familles d'ET et les domaines de la chromatine identifiés.Pour conclure ce manuscrit de thèse, nous présentons une ouverture concernant la dynamique des génomes par rapport aux différents aspects abordés. Ensuite, nous présentons les limites conceptuelles, applicatives et techniques identifiées par notre modèle expérimental. Enfin, nous proposons quelques perspectives sur la portée de nos contributions au-delà de mon projet doctoral.
Fichier principal
Vignette du fichier
MANSOUR_2021_archivage.pdf (35.46 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03630083 , version 1 (04-04-2022)

Identifiants

  • HAL Id : tel-03630083 , version 1

Citer

Yasmine Mansour. Investigating the impact of repetitive DNA on genome dynamics : Towards a focus on mosquito genomes. Genomics [q-bio.GN]. Université Montpellier, 2021. English. ⟨NNT : 2021MONTS116⟩. ⟨tel-03630083⟩
102 Consultations
28 Téléchargements

Partager

Gmail Facebook X LinkedIn More