Riemannian geometry for statistical estimation and learning : application to remote sensing - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Riemannian geometry for statistical estimation and learning : application to remote sensing

Géométrie riemannienne pour l'estimation et l'apprentissage statistiques : application à la télédétection

Résumé

Remote sensing systems offer an increased opportunity to record multi-temporal and multidimensional images of the earth's surface. This opportunity greatly increases the interest in data processing tools based on multivariate image time series. In this thesis, we propose a clusteringclassification pipeline to segment these data. To do so, robust statistics are estimated and then clustered or classified to obtain a segmentation of the original multivariate image time series. A large part of the thesis is devoted to the theory of Riemannian geometry and its subfield, the information geometry, which studies Riemannian manifolds whose points are probability distributions. It allows to estimate robust statistics very quickly, even on large scale problems, but also to compute Riemannian centers of mass. Indeed, divergences are developed to measure the proximities between the estimated statistics. Then, groups of statistics are averaged by computing their Riemannian centers of mass associated to these divergences. Thus, we adapt classical machine learning algorithms such as the K-means++ or the Nearest centroid classifier to Riemannian manifolds. These algorithms have been implemented for many different combinations of statistics, divergences and Riemannian centers of mass and tested on real datasets such as the Indian pines image and the large crop type mapping dataset Breizhcrops.
Les systèmes de télédétection offrent une opportunité accrue d'enregistrer des séries temporelles d'images multivariées de la surface de la Terre. Ainsi, l'intérêt pour les outils automatiques de traitement de ces données augmente considérablement. Dans cette thèse, nous proposons un pipeline de partitionnement et de classification pour segmenter des séries temporelles d'images multivariées. Pour ce faire, des paramètres de lois de probabilité sont estimés de manière robuste puis partitionnés ou classifiés. Une grande partie de la thèse est consacrée à la théorie de la géométrie riemannienne et à son sous-domaine, la géométrie de l'information, qui étudie les variétés riemanniennes dont les points sont des distributions de probabilité. Elle permet d'estimer des paramètres de lois de probabilité très rapidement, même sur des problèmes à grande échelle, mais aussi de calculer des centres de masse riemanniens. En effet, des divergences sont développées pour mesurer les proximités entre les paramètres estimés. Ensuite, des groupes de paramètres sont moyennés en calculant leurs centres de masse riemanniens associés à ces divergences. Ainsi, nous adaptons des algorithmes classiques d'apprentissage automatique tels que le K-means++ ou le classifieur du centroïde le plus proche à des variétés riemanniennes. Ces algorithmes ont été mis en œuvre pour de nombreuses combinaisons de paramètres, divergences et centres de masse riemanniens et testés sur des jeux de données réels tels que l'image Indian pines et le grand jeu de données de cartographie des types de cultures Breizhcrops.
Fichier principal
Vignette du fichier
117712_COLLAS_2022_archivage.pdf (3.89 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03948836 , version 1 (20-01-2023)

Identifiants

  • HAL Id : tel-03948836 , version 1

Citer

Antoine Collas. Riemannian geometry for statistical estimation and learning : application to remote sensing. Signal and Image Processing. Université Paris-Saclay, 2022. English. ⟨NNT : 2022UPASG075⟩. ⟨tel-03948836⟩
135 Consultations
64 Téléchargements

Partager

Gmail Facebook X LinkedIn More