Skip to Main content Skip to Navigation
Theses

Contribution à la sélection de variables en présence de données longitudinales : application à des biomarqueurs issus d'imagerie médicale

Résumé : Les études cliniques permettent de mesurer de nombreuses variables répétées dans le temps. Lorsque l'objectif est de les relier à un critère clinique d'intérêt, les méthodes de régularisation de type LASSO, généralisées aux Generalized Estimating Equations (GEE) permettent de sélectionner un sous-groupe de variables en tenant compte des corrélations intra-patients. Les bases de données présentent souvent des données non renseignées et des problèmes de mesures ce qui entraîne des données manquantes inévitables. L'objectif de ce travail de thèse est d'intégrer ces données manquantes pour la sélection de variables en présence de données longitudinales. Nous utilisons la méthode d'imputation multiple et proposons une fonction d'imputation pour le cas spécifique des variables soumises à un seuil de détection. Nous proposons une nouvelle méthode de sélection de variables pour données corrélées qui intègre les données manquantes : le Multiple Imputation Penalized Generalized Estimating Equations (MI-PGEE). Notre opérateur utilise la pénalité group-LASSO en considérant l'ensemble des coefficients de régression estimés d'une même variable sur les échantillons imputés comme un groupe. Notre méthode permet une sélection consistante sur l'ensemble des imputations, et minimise un critère de type BIC pour le choix du paramètre de régularisation. Nous présentons une application sur l'arthrose du genoux où notre objectif est de sélectionner le sous-groupe de biomarqueurs qui expliquent le mieux les différences de largeur de l'espace articulaire au cours du temps.
Complete list of metadatas

Cited literature [180 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01668517
Contributor : Abes Star :  Contact
Submitted on : Wednesday, December 20, 2017 - 10:03:53 AM
Last modification on : Saturday, December 21, 2019 - 3:52:22 AM

File

GERONIMIJuliatk.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01668517, version 1

Collections

Citation

Julia Geronimi. Contribution à la sélection de variables en présence de données longitudinales : application à des biomarqueurs issus d'imagerie médicale. Algorithme et structure de données [cs.DS]. Conservatoire national des arts et metiers - CNAM, 2016. Français. ⟨NNT : 2016CNAM1114⟩. ⟨tel-01668517⟩

Share

Metrics

Record views

177

Files downloads

441