Contribution à la sélection de variables en présence de données longitudinales : application à des biomarqueurs issus d'imagerie médicale

Résumé : Les études cliniques permettent de mesurer de nombreuses variables répétées dans le temps. Lorsque l'objectif est de les relier à un critère clinique d'intérêt, les méthodes de régularisation de type LASSO, généralisées aux Generalized Estimating Equations (GEE) permettent de sélectionner un sous-groupe de variables en tenant compte des corrélations intra-patients. Les bases de données présentent souvent des données non renseignées et des problèmes de mesures ce qui entraîne des données manquantes inévitables. L'objectif de ce travail de thèse est d'intégrer ces données manquantes pour la sélection de variables en présence de données longitudinales. Nous utilisons la méthode d'imputation multiple et proposons une fonction d'imputation pour le cas spécifique des variables soumises à un seuil de détection. Nous proposons une nouvelle méthode de sélection de variables pour données corrélées qui intègre les données manquantes : le Multiple Imputation Penalized Generalized Estimating Equations (MI-PGEE). Notre opérateur utilise la pénalité group-LASSO en considérant l'ensemble des coefficients de régression estimés d'une même variable sur les échantillons imputés comme un groupe. Notre méthode permet une sélection consistante sur l'ensemble des imputations, et minimise un critère de type BIC pour le choix du paramètre de régularisation. Nous présentons une application sur l'arthrose du genoux où notre objectif est de sélectionner le sous-groupe de biomarqueurs qui expliquent le mieux les différences de largeur de l'espace articulaire au cours du temps.
Type de document :
Thèse
Algorithme et structure de données [cs.DS]. Conservatoire national des arts et metiers - CNAM, 2016. Français. 〈NNT : 2016CNAM1114〉
Liste complète des métadonnées

Littérature citée [190 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01668517
Contributeur : Abes Star <>
Soumis le : mercredi 20 décembre 2017 - 10:03:53
Dernière modification le : mardi 16 janvier 2018 - 03:11:39

Fichier

GERONIMIJuliatk.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01668517, version 1

Collections

Citation

Julia Geronimi. Contribution à la sélection de variables en présence de données longitudinales : application à des biomarqueurs issus d'imagerie médicale. Algorithme et structure de données [cs.DS]. Conservatoire national des arts et metiers - CNAM, 2016. Français. 〈NNT : 2016CNAM1114〉. 〈tel-01668517〉

Partager

Métriques

Consultations de la notice

77

Téléchargements de fichiers

65