s'authentifier
version française rss feed
Fiche détaillée Thèses
ENSAE ParisTech (08/12/2006), Olivier Catoni (Dir.)
Liste des fichiers attachés à ce document : 
PDF
these.pdf(1.5 MB)
Inférence Adaptative, Inductive et Transductive, pour l'Estimation de la Regression et de la Densité
Pierre Alquier1, 2

Cette thèse a pour objet l'étude des
propriétés statistiques d'algorithmes d'apprentissage dans le cas de
l'estimation de la régression et de la densité. Elle est divisée en
trois parties.

La première partie consiste en une généralisation des théorèmes
PAC-Bayésiens, sur la classification, d'Olivier Catoni, au cas de la régression avec une fonction de perte
générale.

Dans la seconde partie, on étudie plus particulièrement le cas de la
régression aux moindres carrés et on propose un nouvel algorithme de
sélection de variables. Cette méthode peut être appliquée notamment
au cas d'une base de fonctions orthonormales, et conduit alors à des
vitesses de convergence optimales, mais aussi au cas de fonctions de
type noyau, elle conduit alors à une variante des méthodes dites
"machines à vecteurs supports" (SVM).

La troisième partie étend les résultats de la seconde au cas de
l'estimation de densité avec perte quadratique.
1 :  LPMA - Laboratoire de Probabilités et Modèles Aléatoires
2 :  CREST - Centre de Recherche en Économie et Statistique
théorie de l'apprentissage statistique – sélection de modèles – régression aux moindres carrés – régions de confiance – inégalités de concentration – bornes pac-bayésiennes – estimation non-paramétrique – estimation adaptative – mesures empiriques de la complexité – schémas de compression – machines à vecteur support – inégalités oracles – estimateurs randomisés – distribution de Gibbs – estimation de la densité – ondelettes – borne sur le risque.

Transductive and Inductive Adaptative Inference for Regression and Density Estimation
The aim of this thesis is the study of statistical properties of
learning algorithm in the case of regression and density estimation.
It is divided into three parts.

In the first part, the idea is to generalize Olivier Catoni's
PAC-Bayesian theorems about classification to the
case of regression estimation with a general loss function.

In the second part, we focus more particularly on the least square
regression and propose a new iterative algorithm for feature
selection. This method can be applied to the case of orthonormal
function basis, leading to optimal rates of convergences, as well as
to kernel type functions, leading to some variants of the well-known
SVM method.

In the third part, we generalize the method proposed in the second
part to the density estimation setting with quadratic loss.
statistical learning theory – modelselection – least square regression estimation – confidence regions – concentration inequalities – pac-bayesian bounds – non-parametricestimation – adaptative estimation – empirical complexity measure – compression schemes – support vector machines – oracle inequalities – randomized estimator – Gibbs distribution – density estimation – wavelets – bound on the risk.

tous les articles de la base du CCSd...
tous les articles de la base du CCSd...
tous les articles de la base du CCSd...