Modélisation conjointe de données longitudinales et de durées de vie - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2002

Modélisation conjointe de données longitudinales et de durées de vie

Jean-François Dupuy
  • Fonction : Auteur

Résumé

The Cox regression model is widely used for the statistical analysis of lifetime data. However, the statistical inference for this model, based on the partial likelihood, often faces problem of missing covariate values. This thesis propose an estimation method for the Cox model with missing values of a time-dependent covariate, and establishes asymptotic properties of the estimators obtained by this method. This method can be applied under less restrictive conditions than other existing methods. It consists in jointly modeling the survival and longitudinal data, and to derive from this joint model a likelihood allowing for estimation in the Cox model with missing covariate values. We first propose a joint model for survival and longitudinal data. This model is made of the Cox model and a model for the covariate which is a step function with jumps at the prespecified observation times. Then, we prove identifiability of the joint model. We then adapt the semiparametric maximum likelihood estimation method to this joint model. We first show existence of semiparametric maximum likelihood estimators. We then obtain a characterization of these estimators, by applying to the joint model the principle underlying the Expectation-Maximization (EM) algorithm. From this characterization, we show that the estimators are consistent and converge in law to a gaussian process. We obtain a convergent estimator of the asymptotic variance of these estimators. We describe the EM algorithm we implemented to estimate the parameters in the joint model. We apply the joint modeling approach to the analysis of informative dropouts in a longitudinal study. Finally, we compare estimations of the regression parameter in the Cox model with missing time-dependent covariate, we obtained from the joint modeling approach and two imputation methods.
Le modèle de régression semiparamétrique de Cox est l'un des plus utilisés pour l'analyse statistique des durées de vie issues du domaine médical ou de la fiabilité. Ses paramètres sont un paramètre de régression et une fonction de risque de base positive et inconnue. L'inférence statistique pour ce modèle, basée sur la vraisemblance partielle de Cox, est souvent compliquée par la présence de données manquantes des covariables. Dans cette thèse, nous proposons une méthode d'estimation des paramètres du modèle de Cox adaptée à cette situation, et nous étudions les propriétés asymptotiques des estimateurs obtenus. La méthode proposée consiste à modéliser conjointement les durées censurées et le processus de covariable afin d'en déduire, par intégration sur les valeurs manquantes de cette covariable, une vraisemblance conjointe permettant d'estimer les paramètres du modèle de Cox au vu des données incomplètes. Dans un premier temps, nous proposons et formalisons un modèle conjoint pour les durées de vie et la covariable longitudinale. Ce modèle est construit à partir du modèle de Cox et d'un modèle de covariable choisi comme étant une fonction en escalier. Nous établissons ensuite l'identifiabilité de ce modèle sous des conditions de régularité peu contraignantes. Puis, nous adaptons au modèle conjoint la méthode du maximum de vraisemblance semiparamétrique. Nous montrons l'existence d'estimateurs semiparamétriques de ses paramètres, et en particulier de ses paramètres d'intérêt, qui sont les paramètres du modèle de Cox. L'expression compliquée de la vraisemblance conjointe ne permet pas d'obtenir analytiquement ces estimateurs. Nous mettons alors en oeuvre l'estimation à l'aide d'un algorithme EM. Nous montrons ensuite la consistance et la normalité asymptotique de nos estimateurs. Puis, nous proposons un estimateur consistant de leur variance asymptotique. Dans une dernière partie, nous appliquons la méthode proposée sur un jeu de données réelles, et nous comparons nos résultats avec deux autres méthodes d'estimation du modèle de Cox avec covariable manquante proposées dans la littérature.
Fichier principal
Vignette du fichier
tel-00002667.pdf (3.52 Mo) Télécharger le fichier

Dates et versions

tel-00002667 , version 1 (01-04-2003)

Identifiants

  • HAL Id : tel-00002667 , version 1

Citer

Jean-François Dupuy. Modélisation conjointe de données longitudinales et de durées de vie. Mathématiques [math]. Université René Descartes - Paris V, 2002. Français. ⟨NNT : ⟩. ⟨tel-00002667⟩
1008 Consultations
550 Téléchargements

Partager

Gmail Facebook X LinkedIn More