Random features for dot product kernels and beyond

Jonas Wacker

Thèse Année : 2022

Random features for dot product kernels and beyond

Caractéristiques aléatoires pour les noyaux de produit scalaire et les noyaux similaires

(1)

Jonas Wacker

Fonction : Auteur
PersonId : 1178233
ORCID : 0000-0002-5531-9401
IdRef : 265233909

Eurecom [Sophia Antipolis]

Résumé

Dot product kernels, such as polynomial and exponential (softmax) kernels, are among the most widely used kernels in machine learning, as they enable modeling the interactions between input features, which is crucial in applications like computer vision, natural language processing, and recommender systems. However, a fundamental drawback of kernel-based statistical models is their limited scalability to a large number of inputs, which requires resorting to approximations. In this thesis, we study techniques to linearize kernel-based methods by means of random feature approximations and we focus on the approximation of polynomial kernels and more general dot product kernels to make these kernels more useful in large scale learning. In particular, we focus on a variance analysis as a main tool to study and improve the statistical efficiency of such sketches.

Les noyaux de produit scalaire, tels que les noyaux polynomiaux et exponentiels (softmax), sont parmi les noyaux les plus utilisés en apprentissage automatique, car ils permettent de modéliser les interactions entre les composantes des vecteurs d'entrée, ce qui est crucial dans des applications telles que la vision par ordinateur, le traitement du langage naturel et les systèmes de recommandation. Cependant, un inconvénient fondamental des modèles statistiques basés sur les noyaux est leur évolutivité limitée à un grand nombre de données d'entrée, ce qui nécessite de recourir à des approximations. Dans cette thèse, nous étudions des techniques pour linéariser les méthodes à base de noyaux de produit scalaire au moyen d'approximations de caractéristiques aléatoires. En particulier, nous nous concentrons sur une analyse de variance pour étudier et améliorer leur efficacité statistique.

Mots clés

Random features Randomized sketches Dot product kernels

Caractéristiques aléatoires Croquis aléatoires Noyaux de produit scalaire Noyaux polynomiaux Processus gaussiens Optical processing unit

Domaines

Apprentissage [cs.LG] Ingénierie assistée par ordinateur

Fichier principal

WACKER_Jonas_2022.pdf (6.37 Mo)

Origine : Version validée par le jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-03829604

Soumis le : mardi 25 octobre 2022-17:28:28

Dernière modification le : mercredi 9 novembre 2022-15:29:12

Archivage à long terme le : vendredi 27 janvier 2023-07:39:58

Dates et versions

tel-03829604 , version 1 (25-10-2022)

Identifiants

HAL Id : tel-03829604 , version 1

Citer

Jonas Wacker. Random features for dot product kernels and beyond. Machine Learning [cs.LG]. Sorbonne Université, 2022. English. ⟨NNT : 2022SORUS241⟩. ⟨tel-03829604⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

EURECOM STAR SORBONNE-UNIVERSITE THESES-SU SU-SCIENCES

123 Consultations

117 Téléchargements

Random features for dot product kernels and beyond

Caractéristiques aléatoires pour les noyaux de produit scalaire et les noyaux similaires

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager