Methods for staistical inference on correlated data : application to genomic data

Résumé : La disponibilité de quantités énormes de données a changé le rôle de la physique par rapport aux autres disciplines. Dans cette thèse, je vais explorer les innovations introduites dans la biologie moléculaire grâce à des approches de physique statistique. Au cours des 20 dernières années, la taille des bases de données sur le génome a augmenté de façon exponentielle : l'exploitation des données brutes, dans le champ d'application de l'extraction d'informations, est donc devenu un sujet majeur dans la physique statistique. Après le succès dans la prédiction de la structure des protéines, des résultats étonnamment bons ont été finalement obtenus aussi pour l'ARN. Cependant, des études récentes ont révélé que, même si les bases de données sont de plus en plus grandes, l'inférence est souvent effectuée dans le régime de sous-échantillonnage et de nouveaux systèmes informatiques sont nécessaires afin de surmonter cette limitation intrinsèque des données réelles. Cette thèse va discuter des méthodes d'inférence et leur application à des prédictions de la structure de l'ARN. Nous allons comprendre certaines approches heuristiques qui ont été appliquées avec succès dans les dernières années, même si théoriquement mal comprises. La dernière partie du travail se concentrera sur le développement d'un outil pour l'inférence de modèles génératifs, en espérant qu'il ouvrira la voie à de nouvelles applications.
Type de document :
Thèse
Physics [physics]. Ecole normale supérieure - ENS PARIS, 2015. English. 〈NNT : 2015ENSU0033〉
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-01661590
Contributeur : Abes Star <>
Soumis le : mardi 12 décembre 2017 - 01:23:20
Dernière modification le : mardi 24 avril 2018 - 17:20:04

Fichier

THESISDeLeonardis.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01661590, version 1

Collections

STAR | UPMC | USPC | PSL | LPS

Citation

Eleonora De Leonardis. Methods for staistical inference on correlated data : application to genomic data. Physics [physics]. Ecole normale supérieure - ENS PARIS, 2015. English. 〈NNT : 2015ENSU0033〉. 〈tel-01661590〉

Partager

Métriques

Consultations de la notice

120

Téléchargements de fichiers

10