Analyse statistique des données issues des biopuces à ADN - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2005

Statistical analysis of microarray data

Analyse statistique des données issues des biopuces à ADN

Julie Peyre
  • Fonction : Auteur
  • PersonId : 832838
  • IdRef : 095978518

Résumé

This dissertation is dedicated to the statistical analysis of microarray data. We consider three issues linked to the transcriptome data.

In the first chapter, we study the problem of data normalisation; its purpose is to eliminate the parasite differences between samples, so as to retain only those variations that are due to biological phenomena. We present several existing normalisation methods and we propose improvements for some of them. Furthermore, in order to guide the choice among those methods, we develop a procedure to simulate microarray data.

In the second chapter, we deal with the detection of differentially expressed genes between two series of experiments, an issue that we assimilate to a multiple hypothesis testing problem. Several approaches are studied\string: model selection and penalty, FDR method based on a wavelet decomposition of the test statistics and Bayesian thresholding.

In the last chapter, we consider the problem of supervised classification of microarray data. To cope with the high-dimensionality issue, we develop a semiparametric method for dimension reduction, based on the maximisation of a local likelihood criterion in generalized linear single-index models. The dimension reduction step is then followed by a local polynomial regression step, in order to perform the supervised classification of the given individuals.
Cette thèse est consacrée à l'analyse statistique des données issues des biopuces à ADN. Nous nous intéressons ici à trois problématiques liées aux données du transcriptôme.

Dans un premier chapitre, nous étudions le problème de la normalisation des données dont l'objectif est d'éliminer les variations parasites entre les échantillons des populations pour ne conserver que les variations expliquées par les phénomènes biologiques. Nous présentons plusieurs méthodes existantes pour lesquelles nous proposons des améliorations. Pour guider le choix d'une méthode de normalisation, une méthode de simulation de données de biopuces est mise au point.

Dans un deuxième chapitre, nous abordons le problème de la détection de gènes différentiellement exprimés entre deux séries d'expériences. On se ramène ici à un problème de test d'hypothèses multiples. Plusieurs approches sont envisagées : sélection de modèles et pénalisation, méthode FDR basée sur une décomposition en ondelettes des statistiques de test ou encore seuillage bayésien.

Dans le dernier chapitre, nous considérons les problèmes de classification supervisée pour les données de biopuces. Pour remédier au problème du "fléau de la dimension", nous avons développé une méthode semi-paramétrique de réduction de dimension, basée sur la maximisation d'un critère de vraisemblance locale dans les modèles linéaires généralisés en indice simple. L'étape de réduction de dimension est alors suivie d'une étape de régression par polynômes locaux pour effectuer la classification supervisée des individus considérés.
Fichier principal
Vignette du fichier
theseJuliePeyre.pdf (5.72 Mo) Télécharger le fichier
SoutenanceJuliePeyre.pdf (2.26 Mo) Télécharger le fichier
Format : Autre

Dates et versions

tel-00012041 , version 1 (26-03-2006)

Identifiants

  • HAL Id : tel-00012041 , version 1

Citer

Julie Peyre. Analyse statistique des données issues des biopuces à ADN. Mathématiques [math]. Université Joseph-Fourier - Grenoble I, 2005. Français. ⟨NNT : ⟩. ⟨tel-00012041⟩
256 Consultations
734 Téléchargements

Partager

Gmail Facebook X LinkedIn More