High-dimensional Learning for Extremes - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2020

High-dimensional Learning for Extremes

Apprentissage des extrêmes en grande dimension

Résumé

Studying the dependence of extreme events has so far only been dealt in low dimension. The aim of this thesis is to develop a statistical approach to learn the dependence structure of extremes in a high-dimensional setting. The first chapter brings together the main results concerning multivariate extreme value theory. The different tools needed in the following chapters are introduced, notably the concept of regularly varying random vectors, but also the notions of statistical learning, high-dimensional statistics and model selection. The second chapter is a joint work with Olivier Wintenberger. It outlines the concept of sparse regular variation defined via the Euclidean projection onto the simplex and which extends the standard notion of regular variation. This approach introduces sparsity into the study of multivariate extremes and thus reduces the dimension. The third chapter presents a work in progress with Olivier Wintenberger on a statistical approach of sparsely regularly varying random vectors. The idea of this chapter is to bring out a method which allows us to identify the subsets of R^d on which extremes concentrate. Based on a multinomial model selection, this method of extremes' detection also provides a way to identify the optimal threshold above which the data are considered to be extreme. In simulations, we provide numerical evidence of our theoretical findings and illustrate our approach on some data-driven examples. Finally, the fourth chapter discusses the article by Engelke & Hitz (2020) in which the authors define a notion of conditional independence for a multivariate Pareto distribution. We extend their approach with the study of the minimum of the marginals of a regularly varying random vector.
L'étude de la dépendance des événements extrêmes a été jusqu'à présent essentiellement traitée en petite dimension. Le but de cette thèse est de développer une approche statistique permettant d'apprendre la structure de dépendance des extrêmes dans un contexte de grande dimension. Le premier chapitre rassemble les résultats principaux concernant la théorie des valeurs extrêmes multivariées. Les différents outils nécessaires aux chapitres suivants sont présentés, notamment le concept de vecteurs aléatoires à variation régulière, mais également les notions d'apprentissage statistique, de statistique en grande dimension et de sélection de modèles. Le deuxième chapitre est un travail conjoint avec Olivier Wintenberger. Il expose le concept de variation régulière parcimonieuse, définie via la projection euclidienne sur le simplexe, et qui étend la notion standard de variation régulière. Cette approche introduit de la parcimonie dans l'étude des extrêmes multivariés et réduit ainsi la dimension. Le troisième chapitre est un travail en cours avec Olivier Wintenberger sur une approche statistique des vecteurs aléatoires à variation régulière parcimonieuse. L'idée de ce chapitre est de proposer une méthode qui permet d'identifier les sous-ensembles de R^d sur lesquels les valeurs extrêmes se concentrent. Basée sur la sélection de modèles multinomiaux, cette méthode de détection des extrêmes permet également d'identifier de manière ad hoc le seuil optimal au-delà duquel les données sont considérées comme extrêmes. Au niveau des simulations, nous fournissons des preuves numériques de nos résultats théoriques et nous illustrons notre approche sur quelques exemples basés sur des données réelles. Enfin, le quatrième chapitre propose une discussion de l'article de Engelke & Hitz (2020) dans lequel les auteurs définissent une notion d'indépendance conditionnelle pour une loi de Pareto multivariée. On étend leur approche en s'appuyant sur l'étude du minimum des marginales d'un vecteur aléatoire à variation régulière.
Fichier principal
Vignette du fichier
manuscrit_meyer_nicolas_tel.pdf (1.55 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-02977794 , version 1 (26-10-2020)
tel-02977794 , version 2 (08-10-2021)

Identifiants

  • HAL Id : tel-02977794 , version 1

Citer

Nicolas Meyer. High-dimensional Learning for Extremes. Statistics [math.ST]. Sorbonne Université, 2020. English. ⟨NNT : ⟩. ⟨tel-02977794v1⟩
540 Consultations
360 Téléchargements

Partager

Gmail Facebook X LinkedIn More