Estimation non paramétrique de densités conditionnelles : grande dimension, parcimonie et algorithmes gloutons.

Minh-Lien Jeanne Nguyen

Thèse Année : 2019

Nonparametric estimation of sparse conditional densities in moderately large dimensions by greedy algorithms.

Estimation non paramétrique de densités conditionnelles : grande dimension, parcimonie et algorithmes gloutons.

(1, 2)

1
2

Minh-Lien Jeanne Nguyen

Fonction : Auteur

Laboratoire de Mathématiques d'Orsay

Statistique mathématique et apprentissage

Résumé

We consider the problem of conditional density estimation in moderately large dimen- sions. Much more informative than regression functions, conditional densities are of main interest in recent methods, particularly in the Bayesian framework (studying the posterior distribution, find- ing its modes...). After recalling the estimation issues in high dimension in the introduction, the two following chapters develop on two methods which address the issues of the curse of dimensionality: being computationally efficient by a greedy iterative procedure, detecting under some suitably defined sparsity conditions the relevant variables, while converging at a quasi-optimal minimax rate. More precisely, the two methods consider kernel estimators well-adapted for conditional density estimation and select a pointwise multivariate bandwidth by revisiting the greedy algorithm RODEO (Regular- isation Of Derivative Expectation Operator). The first method having some initialization problems and extra logarithmic factors in its convergence rate, the second method solves these problems, while adding adaptation to the smoothness. In the penultimate chapter, we discuss the calibration and nu- merical performance of these two procedures, before giving some comments and perspectives in the last chapter.

Nous considérons le problème d’estimation de densités conditionnelles en modérément grandes dimensions. Beaucoup plus informatives que les fonctions de régression, les densités condi- tionnelles sont d’un intérêt majeur dans les méthodes récentes, notamment dans le cadre bayésien (étude de la distribution postérieure, recherche de ses modes...). Après avoir rappelé les problèmes liés à l’estimation en grande dimension dans l’introduction, les deux chapitres suivants développent deux méthodes qui s’attaquent au fléau de la dimension en demandant : d’être efficace computation- nellement grâce à une procédure itérative gloutonne, de détecter les variables pertinentes sous une hypothèse de parcimonie, et converger à vitesse minimax quasi-optimale. Plus précisément, les deux méthodes considèrent des estimateurs à noyau bien adaptés à l’estimation de densités conditionnelles et sélectionnent une fenêtre multivariée ponctuelle en revisitant l’algorithme glouton RODEO (Re- gularisation Of Derivative Expectation Operator). La première méthode ayant des problèmes d’ini- tialisation et des facteurs logarithmiques supplémentaires dans la vitesse de convergence, la seconde méthode résout ces problèmes, tout en ajoutant l’adaptation à la régularité. Dans l’avant-dernier cha- pitre, on traite de la calibration et des performances numériques de ces deux procédures, avant de donner quelques commentaires et perspectives dans le dernier chapitre.

Mots clés

Kernel density estimators Conditional density Greedy algorithms High dimension Sparsity Nonparametric estimation

Densité conditionnelle Algorithmes gloutons Parcimonie Estimation non paramétrique Estimateurs à noyau Grande dimension

Domaines

Statistiques [math.ST]

Fichier principal

72033_NGUYEN_2019_archivage.pdf (2.48 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-02289115

Soumis le : lundi 16 septembre 2019-12:54:06

Dernière modification le : jeudi 14 mars 2024-03:12:55

Archivage à long terme le : samedi 8 février 2020-16:06:09

Dates et versions

tel-02289115 , version 1 (16-09-2019)

Identifiants

HAL Id : tel-02289115 , version 1

Citer

Minh-Lien Jeanne Nguyen. Estimation non paramétrique de densités conditionnelles : grande dimension, parcimonie et algorithmes gloutons.. Statistiques [math.ST]. Université Paris-Saclay, 2019. Français. ⟨NNT : 2019SACLS185⟩. ⟨tel-02289115⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS INRIA STAR LM-ORSAY LM-ORSAY-THESES INRIA2 UNIV-PARIS-SACLAY GS-MATHEMATIQUES GS-COMPUTER-SCIENCE

421 Consultations

547 Téléchargements

Nonparametric estimation of sparse conditional densities in moderately large dimensions by greedy algorithms.

Estimation non paramétrique de densités conditionnelles : grande dimension, parcimonie et algorithmes gloutons.

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager