Probabilistic and Bayesian nonparametric approaches for recommender systems and networks

Adrien Todeschini 1
1 CQFD - Quality control and dynamic reliability
IMB - Institut de Mathématiques de Bordeaux, Inria Bordeaux - Sud-Ouest
Résumé : Nous proposons deux nouvelles approches pour les systèmes de recommandation et les réseaux. Dans la première partie, nous donnons d’abord un aperçu sur les systèmes de recommandation avant de nous concentrer sur les approches de rang faible pour la complétion de matrice. En nous appuyant sur une approche probabiliste, nous proposons de nouvelles fonctions de pénalité sur les valeurs singulières de la matrice de rang faible. En exploitant une représentation de modèle de mélange de cette pénalité, nous montrons qu’un ensemble de variables latentes convenablement choisi permet de développer un algorithme espérance-maximisation afin d’obtenir un maximum a posteriori de la matrice de rang faible complétée. L’algorithme résultant est un algorithme à seuillage doux itératif qui adapte de manière itérative les coefficients de réduction associés aux valeurs singulières. L’algorithme est simple à mettre en œuvre et peut s’adapter à de grandes matrices. Nous fournissons des comparaisons numériques entre notre approche et de récentes alternatives montrant l’intérêt de l’approche proposée pour la complétion de matrice à rang faible. Dans la deuxième partie, nous présentons d’abord quelques prérequis sur l’approche bayésienne non paramétrique et en particulier sur les mesures complètement aléatoires et leur extension multivariée, les mesures complètement aléatoires composées. Nous proposons ensuite un nouveau modèle statistique pour les réseaux creux qui se structurent en communautés avec chevauchement. Le modèle est basé sur la représentation du graphe comme un processus ponctuel échangeable, et généralise naturellement des modèles probabilistes existants à structure en blocs avec chevauchement au régime creux. Notre construction s’appuie sur des vecteurs de mesures complètement aléatoires, et possède des paramètres interprétables, chaque nœud étant associé un vecteur représentant son niveau d’affiliation à certaines communautés latentes. Nous développons des méthodes pour simuler cette classe de graphes aléatoires, ainsi que pour effectuer l’inférence a posteriori. Nous montrons que l’approche proposée peut récupérer une structure interprétable à partir de deux réseaux du monde réel et peut gérer des graphes avec des milliers de nœuds et des dizaines de milliers de connections.
Type de document :
Thèse
Computation [stat.CO]. Université de Bordeaux, 2016. English. 〈NNT : 2016BORD0237〉
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-01583045
Contributeur : Abes Star <>
Soumis le : jeudi 14 septembre 2017 - 15:10:57
Dernière modification le : vendredi 15 septembre 2017 - 01:06:39

Fichier

TODESCHINI_ADRIEN_2016.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01583045, version 1

Collections

Citation

Adrien Todeschini. Probabilistic and Bayesian nonparametric approaches for recommender systems and networks. Computation [stat.CO]. Université de Bordeaux, 2016. English. 〈NNT : 2016BORD0237〉. 〈tel-01583045〉

Partager

Métriques

Consultations de la notice

221

Téléchargements de fichiers

92