2453 articles  [version française]
Detailed view PhD thesis
Université Pierre et Marie Curie - Paris VI (15/12/2008), Eduardo Rocha (Dir.)
Attached file list to this document: 
PDF
these.pdf(19.1 MB)
Caractérisation et analyse évolutive des répétitions intragéniques : une étude au niveau des gènes, des séquences protéiques et des structures tridimensionnelles
Anne-Laure Abraham1, 2

Les duplications jouent un rôle important dans l'évolution des protéines et sont à l'origine des répétitions intragéniques présentes dans environ 14% des séquences protéiques. Nous avons choisi d'étudier ces répétitions d'un point de vue évolutif. Pour cela, nous avons développé un programme, Swelfe, qui cherche les répétitions à la fois dans les gènes, les séquences d'acides aminés et les structures tridimensionnelles des protéines. Ce programme utilise le même algorithme de programmation dynamique à tous les niveaux et une représentation séquentielle des structures 3D. Les scores et les tests de significativité des répétitions obtenues ont été adaptés pour chaque niveau. Nous avons créé une banque contenant les séquences d'ADN et d'acides aminés correspondant aux structures de la PDB, et comparé Swelfe à DALI pour valider la méthode au niveau des répétitions structurales. Enfin, ce programme est disponible à http://bioserv.rpbs.jussieu.fr/swelfe. Swelfe a trouvé un nombre important de répétitions dans un ensemble non redondant de séquences nucléiques, séquences protéiques et structures tridimensionnelles, et environ 10% des protéines contiennent des répétitions à au moins un niveau. Cependant, le recouvrement des répétitions aux trois niveaux est assez faible et beaucoup de répétitions ne sont trouvées qu'à un seul niveau, ce qui confirme l'intérêt de cette étude sur les trois niveaux en parallèle L'étude des répétitions structurales longues montre qu'environ 30% de ces répétitions sont symétriques à 180°, comme le sont les deux éléments d'un homo-dimère. L'analyse de ces protéines indique que certaines pourraient effectivement remplacer des dimères.
1:  ABI - Atelier de BioInformatique
2:  Génomique évolutive des microbes
répétitions – gènes – séquences protéiques – structures – évolution – structure quaternaire

Characterisation and evolutionary analysis of intragenic repeats: a study in genes, protein sequences and three-dimensional structures of proteins
Duplications play a major role in protein evolution and result in intragenic repeats found in about 14% of protein sequences. We chose to study these repeats from an evolutionary point of view. For this, we developed a program, Swelfe, that looks for repeats in genes, amino acid sequences and three dimensional structures of proteins. This program uses the same dynamic programming algorithm at all levels and a sequential representation of 3D structures. Repeat scores and significance tests are adapted at each level. We created a bank containing DNA sequences and amino acid sequences corresponding to PDB structures, and Swelfe was compared to DALI to validate our method concerning structural repeats. Finally this program is available at http://bioserv.rpbs.jussieu.fr/swelfe. Swelfe found an important number of repeats in a non redundant data set of DNA sequences, amino acid sequences and 3D structures and about 10% of proteins contain repeats at last at one level. However the repeat overlap at the three level is weak and most repeats are only found at one level, this confirm the relevance of studying repeats at three levels at the same time. The study of long structural repeats shows that about 30% of these repeats are symmetrical at 180°, as are the two elements of a homodimer. The analysis of these proteins shows that some of them could effectively replace homodimers.
repeats – genes – protein sequences – structures – evolution – quaternary structure