Analyse statistique des données issues des biopuces à ADN

Julie Peyre

Thèse Année : 2005

Statistical analysis of microarray data

Analyse statistique des données issues des biopuces à ADN

(1)

Julie Peyre

Fonction : Auteur
PersonId : 832838
IdRef : 095978518

Laboratoire de Modélisation et Calcul

Résumé

This dissertation is dedicated to the statistical analysis of microarray data. We consider three issues linked to the transcriptome data.

In the first chapter, we study the problem of data normalisation; its purpose is to eliminate the parasite differences between samples, so as to retain only those variations that are due to biological phenomena. We present several existing normalisation methods and we propose improvements for some of them. Furthermore, in order to guide the choice among those methods, we develop a procedure to simulate microarray data.

In the second chapter, we deal with the detection of differentially expressed genes between two series of experiments, an issue that we assimilate to a multiple hypothesis testing problem. Several approaches are studied\string: model selection and penalty, FDR method based on a wavelet decomposition of the test statistics and Bayesian thresholding.

In the last chapter, we consider the problem of supervised classification of microarray data. To cope with the high-dimensionality issue, we develop a semiparametric method for dimension reduction, based on the maximisation of a local likelihood criterion in generalized linear single-index models. The dimension reduction step is then followed by a local polynomial regression step, in order to perform the supervised classification of the given individuals.

Cette thèse est consacrée à l'analyse statistique des données issues des biopuces à ADN. Nous nous intéressons ici à trois problématiques liées aux données du transcriptôme.

Dans un premier chapitre, nous étudions le problème de la normalisation des données dont l'objectif est d'éliminer les variations parasites entre les échantillons des populations pour ne conserver que les variations expliquées par les phénomènes biologiques. Nous présentons plusieurs méthodes existantes pour lesquelles nous proposons des améliorations. Pour guider le choix d'une méthode de normalisation, une méthode de simulation de données de biopuces est mise au point.

Dans un deuxième chapitre, nous abordons le problème de la détection de gènes différentiellement exprimés entre deux séries d'expériences. On se ramène ici à un problème de test d'hypothèses multiples. Plusieurs approches sont envisagées : sélection de modèles et pénalisation, méthode FDR basée sur une décomposition en ondelettes des statistiques de test ou encore seuillage bayésien.

Dans le dernier chapitre, nous considérons les problèmes de classification supervisée pour les données de biopuces. Pour remédier au problème du "fléau de la dimension", nous avons développé une méthode semi-paramétrique de réduction de dimension, basée sur la maximisation d'un critère de vraisemblance locale dans les modèles linéaires généralisés en indice simple. L'étape de réduction de dimension est alors suivie d'une étape de régression par polynômes locaux pour effectuer la classification supervisée des individus considérés.

Mots clés

microarrays mutiple hypothesis testing variable selection generalized linear models semiparametric regression.

modèles linéaires généralisés : régression semi-paramétrique biopuces test d'hypothèses multiples sélection de variables modèles linéaires généralisés : régression semi-paramétrique.

Domaines

Mathématiques [math]

Fichier principal

theseJuliePeyre.pdf (5.72 Mo)

SoutenanceJuliePeyre.pdf (2.26 Mo)

Format : Autre

Julie Peyre : Connectez-vous pour contacter le contributeur

https://theses.hal.science/tel-00012041

Soumis le : dimanche 26 mars 2006-15:24:24

Dernière modification le : vendredi 5 avril 2024-03:09:04

Archivage à long terme le : samedi 3 avril 2010-23:02:48

Dates et versions

tel-00012041 , version 1 (26-03-2006)

Identifiants

HAL Id : tel-00012041 , version 1

Citer

Julie Peyre. Analyse statistique des données issues des biopuces à ADN. Mathématiques [math]. Université Joseph-Fourier - Grenoble I, 2005. Français. ⟨NNT : ⟩. ⟨tel-00012041⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS UJF LMC-IMAG

256 Consultations

734 Téléchargements

Statistical analysis of microarray data

Analyse statistique des données issues des biopuces à ADN

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager