Skip to Main content Skip to Navigation
Theses

Classification croisée pour l'analyse de bases de données de grandes dimensions de pharmacovigilance

Résumé : Cette thèse regroupe des contributions méthodologiques à l'analyse statistique des bases de données de pharmacovigilance. Les difficultés de modélisation de ces données résident dans le fait qu'elles produisent des matrices souvent creuses et de grandes dimensions. La première partie des travaux de cette thèse porte sur la classification croisée du tableau de contingence de pharmacovigilance à l’aide du modèle des blocs latents de Poisson normalisé. L'objectif de la classification est d'une part de fournir aux pharmacologues des zones intéressantes plus réduites à explorer de manière plus précise, et d'autre part de constituer une information a priori utilisable lors de l'analyse des données individuelles de pharmacovigilance. Dans ce cadre, nous détaillons une procédure d'estimation partiellement bayésienne des paramètres du modèle et des critères de sélection de modèles afin de choisir le modèle le plus adapté aux données étudiées. Les données étant de grandes dimensions, nous proposons également une procédure pour explorer de manière non exhaustive mais pertinente, l'espace des modèles en coclustering. Enfin, pour mesurer la performance des algorithmes, nous développons un indice de classification croisée calculable en pratique pour un nombre de classes élevé. Les développements de ces outils statistiques ne sont pas spécifiques à la pharmacovigilance et peuvent être utile à toute analyse en classification croisée. La seconde partie des travaux de cette thèse porte sur l'analyse statistique des données individuelles, plus nombreuses mais également plus riches en information. L'objectif est d'établir des classes d'individus selon leur profil médicamenteux et des sous-groupes d'effets et de médicaments possiblement en interaction, palliant ainsi le phénomène de coprescription et de masquage que peuvent présenter les méthodes existantes sur le tableau de contingence. De plus, l'interaction entre plusieurs effets indésirables y est prise en compte. Nous proposons alors le modèle des blocs latents multiple qui fournit une classification croisée simultanée des lignes et des colonnes de deux tableaux de données binaires en leur imposant le même classement en ligne. Nous discutons des hypothèses inhérentes à ce nouveau modèle et nous énonçons des conditions suffisantes de son identifiabilité. Ensuite, nous présentons une procédure d'estimation de ses paramètres et développons des critères de sélection de modèles associés. De plus, un modèle de simulation numérique des données individuelles de pharmacovigilance est proposé et permet de confronter les méthodes entre elles et d'étudier leurs limites. Enfin, la méthodologie proposée pour traiter les données individuelles de pharmacovigilance est explicitée et appliquée à un échantillon de la base française de pharmacovigilance entre 2002 et 2010.
Complete list of metadatas

Cited literature [49 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01806330
Contributor : Abes Star :  Contact
Submitted on : Saturday, June 2, 2018 - 1:05:57 AM
Last modification on : Thursday, July 2, 2020 - 3:40:07 AM
Document(s) archivé(s) le : Monday, September 3, 2018 - 3:27:09 PM

File

72034_ROBERT_2017_diffusion.pd...
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01806330, version 1

Citation

Valérie Robert. Classification croisée pour l'analyse de bases de données de grandes dimensions de pharmacovigilance. Applications [stat.AP]. Université Paris-Saclay, 2017. Français. ⟨NNT : 2017SACLS111⟩. ⟨tel-01806330⟩

Share

Metrics

Record views

482

Files downloads

360