Skip to Main content Skip to Navigation
Theses

Algorithmes de graphes pour la recherche de motifs récurrents dans les structures tertiaires d'ARN

Mahassine Djelloul 1, 2
2 AMIB - Algorithms and Models for Integrative Biology
LIX - Laboratoire d'informatique de l'École polytechnique [Palaiseau], LRI - Laboratoire de Recherche en Informatique, UP11 - Université Paris-Sud - Paris 11, Inria Saclay - Ile de France
Résumé : Le repliement d'une molécule d'ARN non-codant est initié et stabilisé par ce qu'on appelle les motifs tertiaires. Ces motifs sont présents de manière récurrente dans les ARN de différents organismes vivants; ce qui suggère que leur rôle biologique a été conservé à travers l'évolution. Un recensement exhaustif et détaillé de ces motifs récurrents, incluant nombre d'occurrences et variantes, est donc une étape essentielle pour une meilleure compréhension du phénomène de repliement. Ce recensement peut être obtenu de manière efficace grâce à des méthodes automatiques d'extraction. Un inconvénient majeur des méthodes existantes est que la récurrence d'un motif est démontrée lorsque les occurrences trouvées sont strictement identiques. Dans la réalité, ces occurrences ne sont pas toujours identiques mais similaires en ce sens qu'elles possèdent une sous-structure commune ayant des propriétés biologiques spécifiques. Dans notre approche, une structure tertiaire d'ARN est modélisée par un graphe général étiqueté sur les sommets et les arêtes. Les sommets représentent les nucléotides étiquetés par leur base et leur numéro dans la séquence. Les arêtes représentent les interactions entre les bases étiquetées par leur type d'interaction. Les occurrences d'un motif récurrent deviennent, selon ce modèle, des sous-graphes similaires dont la structure commune est a priori inconnue. Ce type de recherche fait appel au problème du sous-graphe commun maximum bien connu en complexité algorithmique pour être NP-difficile et inapproximable. Ce travail propose (1) une nouvelle mesure de similarité de graphe permettant d'identifier des occurrences similaires d'un motif tertiaire potentiel. Cette mesure est obtenue par un algorithme de calcul d'un sous-graphe commun maximum ayant des propriétés structurales spécifiques, (2) une nouvelle méthode automatique d'extraction et de classification de (familles de) motifs d'ARN récurrents utilisant la nouvelle mesure de similarité. Il existe deux types de motifs tertiaires récurrents : les motifs locaux incrustés dans des éléments de structure secondaire et les motifs d'interaction faisant intervenir deux ou plusieurs éléments de structure secondaire. La méthode d'extraction et classification proposée a été appliquée à un échantillon représentatif de structures d'ARN. Les résultats obtenus ont été expertisés par des biochimistes de l'Institut de Biologie Moléculaire et Cellulaire (IBMC) de Strasbourg.
Complete list of metadatas

Cited literature [73 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-00785953
Contributor : Mireille Regnier <>
Submitted on : Thursday, February 7, 2013 - 1:33:37 PM
Last modification on : Friday, April 10, 2020 - 2:10:28 AM
Document(s) archivé(s) le : Wednesday, May 8, 2013 - 3:54:31 AM

Identifiers

  • HAL Id : tel-00785953, version 1

Collections

Citation

Mahassine Djelloul. Algorithmes de graphes pour la recherche de motifs récurrents dans les structures tertiaires d'ARN. Bio-informatique [q-bio.QM]. Université Paris Sud - Paris XI, 2009. Français. ⟨tel-00785953⟩

Share

Metrics

Record views

771

Files downloads

2178