s'authentifier
version française rss feed
Fiche détaillée HDR
Université des Sciences et Technologie de Lille - Lille I (28/11/2012), Gilles Celeux (Pr.)
Liste des fichiers attachés à ce document : 
PDF
HDR-JJ.pdf(2.1 MB)
ANNEX
slides-HDR-JJ.pdf(1.9 MB)
Contribution à l'apprentissage statistique à base de modèles génératifs pour données complexes.
Julien Jacques1, 2

Ce mémoire synthétise les activités de recherche que j'ai menées de 2005 à 2012, sur la thématique de l'apprentissage statistique des données complexes, abordée par le biais de modèles probabilistes paramétriques génératifs. Plusieurs types de données complexes sont considérées. Les données issues de populations différentes ont été abordées en proposant des modèles de lien paramétriques entre populations, permettant d'adapter les modèles statistiques d'une population vers l'autre, en évitant une lourde collecte de nouvelles données. Les données de rang, définissant un classement d'objets selon un ordre de préférence, les données ordinales, qui sont des données qualitatives ayant des modalités ordonnées, et les données fonctionnelles, où l'observation statistique consiste en une ou plusieurs courbes, ont également été étudies. Pour ces trois types de données, des modèles génératifs probabilistes ont été définis et utilisés en classification automatique de données multivariées. Enfin les données de grande dimension, que l'on rencontre lorsque le nombre de variables du problème dépasse celui des observations, ont été étudiées dans un cadre de régression. Deux approches, fruits de deux thèses de doctorat que je co-encadre, sont proposés: l'une utilisant des algorithmes d'optimisation combinatoire pour explorer de façon efficace l'espace des variables, et l'autre définissant un modèle de régression regroupant ensemble les variables ayant un effet similaire.
1 :  LPP - Laboratoire Paul Painlevé
2 :  INRIA Lille - Nord Europe - MODAL
apprentissage statistique – apprentissage adaptatif – modèles génératifs – données de rang – données ordinales – données fonctionnelles – grande dimension – classification automatique.

Contribution to statistical learning of complex data using generative models
This manuscript presents my research activities, which mainly focus on designing parametric, parsimonious and meaningful generative models for complex data. Several kinds of complex data have been studied. Data sampled from different populations (transfer learning) has been addressed by designing parametric models for the link between the different populations. Thus, statistical models can be adapted from one population to another one by sparing a large collect of new data. Ranking data, which results from ranking of objects by a judge according to a preference order, ordinal data, which are categorical data with ordered categories, and functional data, in which the statistical unit consists of one or several curves, have also been studied. For this three kinds of complex data, generative models have been developed and used for the clustering of multidimensional data. The last kind of complex data, high dimensional data, has been studied in a regression context. In this domain, two approaches are proposed by two Ph.D. students I co-supervise\string: the first one uses combinatorial optimization algorithms in order to efficiently explore the feature space and the second one defines a regression model in which the variables having a similar effect on the output are grouped together.
statistical learning – transfer learning – generative model – ranking data – ordinal data – functional data – high dimensional problem – clustering.

tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...