Random features for dot product kernels and beyond - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2022

Random features for dot product kernels and beyond

Caractéristiques aléatoires pour les noyaux de produit scalaire et les noyaux similaires

Jonas Wacker

Résumé

Dot product kernels, such as polynomial and exponential (softmax) kernels, are among the most widely used kernels in machine learning, as they enable modeling the interactions between input features, which is crucial in applications like computer vision, natural language processing, and recommender systems. However, a fundamental drawback of kernel-based statistical models is their limited scalability to a large number of inputs, which requires resorting to approximations. In this thesis, we study techniques to linearize kernel-based methods by means of random feature approximations and we focus on the approximation of polynomial kernels and more general dot product kernels to make these kernels more useful in large scale learning. In particular, we focus on a variance analysis as a main tool to study and improve the statistical efficiency of such sketches.
Les noyaux de produit scalaire, tels que les noyaux polynomiaux et exponentiels (softmax), sont parmi les noyaux les plus utilisés en apprentissage automatique, car ils permettent de modéliser les interactions entre les composantes des vecteurs d'entrée, ce qui est crucial dans des applications telles que la vision par ordinateur, le traitement du langage naturel et les systèmes de recommandation. Cependant, un inconvénient fondamental des modèles statistiques basés sur les noyaux est leur évolutivité limitée à un grand nombre de données d'entrée, ce qui nécessite de recourir à des approximations. Dans cette thèse, nous étudions des techniques pour linéariser les méthodes à base de noyaux de produit scalaire au moyen d'approximations de caractéristiques aléatoires. En particulier, nous nous concentrons sur une analyse de variance pour étudier et améliorer leur efficacité statistique.
Fichier principal
Vignette du fichier
WACKER_Jonas_2022.pdf (6.37 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-03829604 , version 1 (25-10-2022)

Identifiants

  • HAL Id : tel-03829604 , version 1

Citer

Jonas Wacker. Random features for dot product kernels and beyond. Machine Learning [cs.LG]. Sorbonne Université, 2022. English. ⟨NNT : 2022SORUS241⟩. ⟨tel-03829604⟩
123 Consultations
117 Téléchargements

Partager

Gmail Facebook X LinkedIn More