Advanced Random Matrix Methods for Machine Learning

Malik Tiomoko

Thèse Année : 2021

Advanced Random Matrix Methods for Machine Learning

Méthodes avancées de la théorie des matrices aléatoires pour l'apprentissage automatique

(1, 2)

1
2

Malik Tiomoko

Fonction : Auteur
PersonId : 1091598

Laboratoire des signaux et systèmes

GIPSA Pôle Géométrie, Apprentissage, Information et Algorithmes

Résumé

Machine Learning (ML) has been quite successful to solve many real-world applications going from supervised to unsupervised tasks due to the development of powerful algorithms (Support Vector Machine (SVM), Deep Neural Network, Spectral Clustering, etc). These algorithms are based on optimization schemes motivated by low dimensional intuitions which collapse in high dimension, a phenomenon known as the "curse of dimensionality''. Nonetheless, by assuming the data dimension and their number to be both large and comparable, Random Matrix Theory (RMT) provides a systematic approach to assess the (statistical) behavior of these large learning systems, to properly understand and improve them when applied to large dimensional data. Previous random matrix analyses (cf. Mai & Couillet, 2018 ; Liao & Couillet, 2019 ; Deng et al., 2019) have shown that asymptotic performances of most machine learning and signal processing methods depend only on first and second-order statistics (means and covariance matrices of the data). This makes covariance matrices extremely rich objects that need to be "well treated and understood". The thesis demonstrates first how poorly naive covariance matrix processing can destroy machine learning algorithms by introducing biases that are difficult to clean, whereas consistent random-matrix estimation of the functionals of interest avoids biases. We then exemplify how means and covariance matrix statistics of the data are sufficient (through simple functionals) to handle the statistical behavior of even quite involved algorithms of modern interest, such as multi-task and transfer learning methods. The large dimensional analysis allows furthermore for an improvement of multi-task and transfer learning schemes.

L'apprentissage automatique a permis de résoudre de nombreuses applications du monde réel, allant des tâches supervisées à des tâches non supervisées, grâce au développement d'algorithmes puissants (machine à vecteurs de support, réseaux neuronaux profonds, regroupement spectral, etc). Ces algorithmes sont basés sur des méthodes d'optimisation motivées par des intuitions de petites dimensions qui s'effondrent en grande dimension, un phénomène connu sous le nom de "malédiction de la dimensionnalité''. Néanmoins, en supposant que la dimension des données et leur nombre sont à la fois grands et comparables, la théorie des matrices aléatoires fournit une approche systématique pour évaluer le comportement (statistique) de ces grands systèmes d'apprentissage, afin de bien les comprendre et de les améliorer lorsqu'ils sont appliqués à des données de grande dimension. Les analyses précédentes de la théorie des matrices aléatoires (cf. Mai & Couillet, 2018 ; Liao & Couillet, 2019 ; Deng et al., 2019) ont montré que les performances asymptotiques de la plupart des méthodes d'apprentissage automatique et de traitement du signal ne dépendent que des statistiques de premier et de second ordre (moyennes et matrices de covariance des données). Ceci fait des matrices de covariance des objets extrêmement riches qui doivent être "bien traités et compris''. La thèse démontre d'abord comment un traitement empirique et naïf de la matrice de covariance peut détruire le comportement d'algorithmes d'apprentissage automatique en introduisant des biais difficiles à supprimer, alors qu'une estimation cohérente des fonctionnelles d'intérêt en utilisant la théorie des matrices aléatoires évite les biais. Nous montrons ensuite comment les moyennes et les matrices de covariance sont suffisantes (par le biais de fonctionnelles simples) pour traiter le comportement d'algorithmes d'intérêt moderne, tels que les méthodes d'apprentissage multi-tâches et par transfert.

Mots clés

Random matrix theory (RMT) Transfer learning Multi-task learning (MTL) Covariance matrices Theory of machine learning

Théorie des matrices aléatoires (TMA) Apprentissage par transfert Apprentissage multi-tâches Matrice de covariance Compréhension théorique de l'apprentissage automatique

Domaines

Machine Learning [stat.ML] Théorie [stat.TH] Intelligence artificielle [cs.AI] Apprentissage [cs.LG] Traitement du signal et de l'image [eess.SP] Statistiques [math.ST]

Fichier principal

101891_TIOMOKO_2021_archivage.pdf (1.57 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-03391681

Soumis le : jeudi 21 octobre 2021-17:14:10

Dernière modification le : jeudi 25 avril 2024-04:23:55

Archivage à long terme le : samedi 22 janvier 2022-19:52:31

Dates et versions

tel-03391681 , version 1 (21-10-2021)

Identifiants

HAL Id : tel-03391681 , version 1

Citer

Malik Tiomoko. Advanced Random Matrix Methods for Machine Learning. Machine Learning [stat.ML]. Université Paris-Saclay, 2021. English. ⟨NNT : 2021UPASG067⟩. ⟨tel-03391681⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

UGA CNRS GIPSA GIPSA-THESE SUP_LSS STAR SUP_SIGNAUX CENTRALESUPELEC UNIV-PARIS-SACLAY GIPSA-GAIA MIAI GS-ENGINEERING GS-COMPUTER-SCIENCE GS-SPORT-HUMAN-MOVEMENT

265 Consultations

298 Téléchargements

Advanced Random Matrix Methods for Machine Learning

Méthodes avancées de la théorie des matrices aléatoires pour l'apprentissage automatique

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager