Contribution à l'apprentissage statistique à base de modèles génératifs pour données complexes.

Julien Jacques 1, 2
2 MODAL - MOdel for Data Analysis and Learning
Inria Lille - Nord Europe, Laboratoire de Mathématiques Paul Painlevé, Santé Publique : Épidémiologie et Qualité des soins
Résumé : Ce mémoire synthétise les activités de recherche que j'ai menées de 2005 à 2012, sur la thématique de l'apprentissage statistique des données complexes, abordée par le biais de modèles probabilistes paramétriques génératifs. Plusieurs types de données complexes sont considérées. Les données issues de populations différentes ont été abordées en proposant des modèles de lien paramétriques entre populations, permettant d'adapter les modèles statistiques d'une population vers l'autre, en évitant une lourde collecte de nouvelles données. Les données de rang, définissant un classement d'objets selon un ordre de préférence, les données ordinales, qui sont des données qualitatives ayant des modalités ordonnées, et les données fonctionnelles, où l'observation statistique consiste en une ou plusieurs courbes, ont également été étudies. Pour ces trois types de données, des modèles génératifs probabilistes ont été définis et utilisés en classification automatique de données multivariées. Enfin les données de grande dimension, que l'on rencontre lorsque le nombre de variables du problème dépasse celui des observations, ont été étudiées dans un cadre de régression. Deux approches, fruits de deux thèses de doctorat que je co-encadre, sont proposés: l'une utilisant des algorithmes d'optimisation combinatoire pour explorer de façon efficace l'espace des variables, et l'autre définissant un modèle de régression regroupant ensemble les variables ayant un effet similaire.
Type de document :
HDR
Statistiques [math.ST]. Université des Sciences et Technologie de Lille - Lille I, 2012


https://tel.archives-ouvertes.fr/tel-00761184
Contributeur : Julien Jacques <>
Soumis le : mercredi 5 décembre 2012 - 09:52:48
Dernière modification le : mercredi 7 octobre 2015 - 01:15:01
Document(s) archivé(s) le : mercredi 6 mars 2013 - 04:20:12

Identifiants

  • HAL Id : tel-00761184, version 1

Collections

Citation

Julien Jacques. Contribution à l'apprentissage statistique à base de modèles génératifs pour données complexes.. Statistiques [math.ST]. Université des Sciences et Technologie de Lille - Lille I, 2012. <tel-00761184>

Exporter

Partager

Métriques

Consultations de
la notice

454

Téléchargements du document

544