Skip to Main content Skip to Navigation
Theses

Contribution à la sélection de variables en présence de données longitudinales : Application à des biomarqueurs issus d'imagerie médicale

Résumé : Dans le cadre des études cliniques, de nombreuses variables peuvent être mesurées de façon répétée dans le temps. Lorsque l'objectif de l'analyse est de les relier à un critère clinique d'intérêt, les méthodes de régularisation de type LASSO, généralisées aux Generalized Estimating Equations (GEE) permettent de sélectionner un sous-groupe de variables en tenant compte des corrélations intra-patients. Cependant, les bases de données présentent souvent des données non renseignées et des problèmes de mesures ce qui entraîne des données manquantes inévitables. L'objectif de ce travail de thèse est d'intégrer ces données manquantes pour la sélection de variables en présence de données longitudinales. Nous utilisons la méthode d'imputation multiple et proposons une fonction d'imputation pour le cas spécifique des variables soumises à un seuil de détection. Nous proposons une nouvelle méthode de sélection de variables pour données corrélées qui intègre les données manquantes : le Multiple Imputation Penalized Generalized Estimating Equations (MI-PGEE). Notre opérateur utilise la pénalité group-LASSO en considérant l'ensemble des coefficients de régression estimés d'une même variable sur les échantillons imputés comme un groupe. Notre méthode permet une sélection consistante sur l'ensemble des imputations, et minimise un critère de type BIC pour le choix du paramètre de régularisation. Nous présentons une application sur l'arthrose du genoux où notre objectif est de sélectionner le sous-groupe de biomarqueurs qui expliquent le mieux les différences de largeur de l'espace articulaire au cours du temps.
Document type :
Theses
Complete list of metadatas

https://tel.archives-ouvertes.fr/tel-01426618
Contributor : Julia Geronimi <>
Submitted on : Wednesday, January 4, 2017 - 5:04:58 PM
Last modification on : Wednesday, March 20, 2019 - 4:52:04 PM
Document(s) archivé(s) le : Wednesday, April 5, 2017 - 2:53:18 PM

Identifiers

  • HAL Id : tel-01426618, version 1

Collections

Citation

Julia Geronimi. Contribution à la sélection de variables en présence de données longitudinales : Application à des biomarqueurs issus d'imagerie médicale. Statistiques [math.ST]. Conservatoire National des Arts et Métiers - CNAM Paris, 2016. Français. ⟨tel-01426618⟩

Share

Metrics

Record views

276

Files downloads

430