Classification d'ARN codants et d'ARN non-codants

Arnaud Fontaine 1, 2
2 BONSAI - Bioinformatics and Sequence Analysis
LIFL - Laboratoire d'Informatique Fondamentale de Lille, Inria Lille - Nord Europe
Résumé : Les travaux présentés dans cette thèse s'inscrivent dans le cadre de l'analyse de phénomènes biologiques par des moyens informatiques, c'est-à-dire la bio-informatique. Nous nous intéressons plus particulièrement à l'analyse de séquences nucléiques. Dans ce cadre, nos travaux se décomposent en deux parties: l'identification de séquences codantes et l'identification de séquences non-codantes partageant une structure conservée telles que des ARN non-codants. L'originalité des méthodes proposées, protea et carnac, réside dans le traitement d'ensembles de séquences nucléiques faiblement conservées sans avoir recours à leur alignement au préalable. Ces méthodes s'appuient sur un même schéma global d'analyse comparative pour identifier des traces laissées par les mécanismes de sélection durant l'évolution, traces globalement cohérentes entre toutes les séquences. Nous avons évalué protea et carnac sur des données de référence pour la communauté et obtenu plusieurs résultats significatifs. Dans le cadre de travaux collaboratifs, nous présentons également deux exemples intégrations de ces logiciels. magnolia est un logiciel qui construit un alignement multiple de séquences nucléiques respectueux de leur fonction commune prédites par protea et/ou carnac. protea et \carnac sont également intégrés dans une plate-forme d'annotation automatique par génomique comparative.
Mots-clés : bio-informatique
Type de document :
Thèse
Bio-informatique [q-bio.QM]. Université des Sciences et Technologie de Lille - Lille I, 2009. Français
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00401991
Contributeur : Helene Touzet <>
Soumis le : vendredi 21 juin 2013 - 14:42:07
Dernière modification le : vendredi 24 juin 2016 - 01:06:05
Document(s) archivé(s) le : dimanche 22 septembre 2013 - 04:08:39

Fichier

Identifiants

  • HAL Id : tel-00401991, version 2

Collections

Citation

Arnaud Fontaine. Classification d'ARN codants et d'ARN non-codants. Bio-informatique [q-bio.QM]. Université des Sciences et Technologie de Lille - Lille I, 2009. Français. <tel-00401991v2>

Partager

Métriques

Consultations de
la notice

234

Téléchargements du document

2563