s'authentifier
version française rss feed
Fiche détaillée Thèses
Université Paris-Diderot - Paris VII (05/11/2009), Alexandre de Brevern (Dir.)
Liste des fichiers attachés à ce document : 
PDF
TheseAurelieBornot.pdf(11.2 MB)
Analyse et prédiction de la relation séquence - structure locale et flexibilité au sein des protéines globulaires
Aurélie Bornot1, 2

La prédiction in silico de la structure tridimensionnelle d'une protéine à partir de sa séquence en acides aminés constitue un défi scientifique d'intérêt majeur. Il est à présent admis que les structures protéiques peuvent être décrites à partir d'un répertoire limité de structures locales récurrentes. Cette observation a conduit au développement de techniques de prédiction de la structure 3D par assemblage de fragments. Ces techniques sont aujourd'hui parmi les plus performantes. Dans ce contexte, la prédiction des structures locales constitue une première étape vers la prédiction de la structure 3D globale d'une protéine. Mon travail de thèse porte principalement sur l'étude des structures protéiques locales à travers deux thèmes : (i) la prédiction des structures locales à partir de la séquence et (ii) l'analyse de la prédictibilité des structures locales en fonction de la flexibilité des structures protéiques. Ces études reposent sur une bibliothèque de 120 fragments chevauchants de 11 résidus de long précédemment développée au sein du laboratoire. Une méthode de prédiction des structures locales à partir de la séquence avait également été mise en place et permettait d'obtenir un taux de prédiction correct de 51 %. La prise en compte de données évolutionnaires couplée à l'utilisation de Machines à Vecteurs de Support a permis d'améliorer la prédiction des structures locales jusqu'à 63 % de prédiction correctes. De plus, un indice de confiance permettant d'évaluer directement la qualité de la prédiction et ainsi d'identifier les régions plus ardues à prédire a été mis au point. Par ailleurs, la structure des protéines n'est pas rigide. Ainsi, j'ai étendu notre analyse à l'étude la prédictibilité structurale des séquences d'acides aminés en fonction de leur flexibilité structurale au sein des protéines. Une analyse des propriétés dynamiques des structures locales a été menée en s'appuyant sur (i) les B-facteurs issus des expériences de cristallographie et (ii) les fluctuations du squelette polypeptidique observées lors de simulations de dynamique moléculaire. Ces analyses de la relation flexibilité-structure locale ont conduit au développement d'une stratégie de prédiction originale de la flexibilité à partir de la séquence. Nos différentes approches constituent une première étape vers la prédiction de la structure tridimensionnelle globale d'une protéine.
1 :  DSIMB - Dynamique des Structures et Interactions des Macromolécules Biologiques
2 :  Institut National de la Transfusion Sanguine
Prédiction de la structure locale des protéines – Prédiction de la flexibilité des protéines – Apprentissage automatique – SVM

Analysis and prediction of the sequence - local structure - flexibility relationships in globular proteins
In silico prediction of protein structure from sequence is a major scientific challenge. It is now admitted that native 3D protein structures can be described by a limited set of recurring local structures. This observation led to the development of protein structure prediction techniques based on fragment assembly methods. Nowadays, these techniques are among the most effective. Protein local structure prediction is the first step toward the generation of global protein models. This thesis work mainly focuses on two major questions: (i) protein local structure prediction from sequence and (ii) the analysis of local structure predictability according to protein structure flexibility features. These analyses were based on a library - previously developed in the laboratory - of 120 3D structural prototypes encompassing all known local protein structures. An associated local structure prediction method from sequence had also been created and yielded a correct prediction rate of 51 %. Here, we achieved a balanced improvement of the prediction rate by coupling evolutionary information with Support Vector Machines. A very satisfying correct prediction rate of 63 % was obtained. Moreover, for directly estimating the quality of the prediction, we developed a confidence index which enables to identify regions that are more difficult to predict. In the same way, protein structures are not rigid macromolecules. Hence, we also extended our analysis and addressed the question of the structural predictability of a sequence with regards to its structural flexibility properties inside protein structures. We analyzed local structure flexibility features in proteins by relying on: (i) B-factors from X-ray experiments and (ii) backbone fluctuations observed in molecular dynamics simulations. Finally, an original flexibility prediction method from sequence was developed. Our different analyses are the first step toward the prediction of 3D global protein models.
Protein local structure prediction – Protein flexibility prediction – Machine learning – SVM

tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...