Sur deux problèmes d’apprentissage automatique : la détection de communautés et l’appariement adaptatif

Lennart Gulikers 1, 2, 3
2 DYOGENE - Dynamics of Geometric Networks
DI-ENS - Département d'informatique de l'École normale supérieure, CNRS - Centre National de la Recherche Scientifique : UMR 8548, Inria de Paris
3 INFINE - INFormation NEtworks
Inria Saclay - Ile de France
Résumé : Dans cette thèse, nous étudions deux problèmes d'apprentissage automatique : (I) la détection des communautés et (II) l'appariement adaptatif. I) Il est bien connu que beaucoup de réseaux ont une structure en communautés. La détection de ces communautés nous aide à comprendre et exploiter des réseaux de tout genre. Cette thèse considère principalement la détection des communautés par des méthodes spectrales utilisant des vecteurs propres associés à des matrices choisiesavec soin. Nous faisons une analyse de leur performance sur des graphes artificiels. Au lieu du modèle classique connu sous le nom de « Stochastic Block Model » (dans lequel les degrés sont homogènes) nous considérons un modèle où les degrés sont plus variables : le « Degree-Corrected Stochastic Block Model » (DC-SBM). Dans ce modèle les degrés de tous les nœuds sont pondérés - ce qui permet de générer des suites des degrés hétérogènes. Nous étudions ce modèle dans deux régimes: le régime dense et le régime « épars », ou « dilué ». Dans le régime dense, nous prouvons qu'un algorithme basé sur une matrice d'adjacence normalisée réussit à classifier correctement tous les nœuds sauf une fraction négligeable. Dans le régime épars il existe un seuil en termes de paramètres du modèle en-dessous lequel n'importe quel algorithme échoue par manque d'information. En revanche, nous prouvons qu'un algorithme utilisant la matrice « non-backtracking » réussit jusqu'au seuil - cette méthode est donc très robuste. Pour montrer cela nous caractérisons le spectre des graphes qui sont générés selon un DC-SBM dans son régime épars. Nous concluons cette partie par des tests sur des réseaux sociaux. II) Les marchés d'intermédiation en ligne tels que des plateformes de Question-Réponse et des plateformes de recrutement nécessitent un appariement basé sur une information incomplète des deux parties. Nous développons un modèle de système d'appariement entre tâches et serveurs représentant le comportement de telles plateformes. Pour ce modèle nous donnons une condition nécessaire et suffisante pour que le système puisse gérer un certain flux de tâches. Nous introduisons également une politique de « back-pressure » sous lequel le débit gérable par le système est maximal. Nous prouvons que cette politique atteint un débit strictement plus grand qu'une politique naturelle « gloutonne ». Nous concluons en validant nos résultats théoriques avec des simulations entrainées par des données de la plateforme Stack-Overflow.
Type de document :
Thèse
Machine Learning [stat.ML]. PSL Research University, 2017. Français. 〈NNT : 2017PSLEE062〉
Liste complète des métadonnées

Littérature citée [40 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01834967
Contributeur : Abes Star <>
Soumis le : mercredi 11 juillet 2018 - 10:00:13
Dernière modification le : dimanche 15 juillet 2018 - 01:08:32
Document(s) archivé(s) le : vendredi 12 octobre 2018 - 14:15:03

Fichier

Gulikers-2017-These.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01834967, version 1

Citation

Lennart Gulikers. Sur deux problèmes d’apprentissage automatique : la détection de communautés et l’appariement adaptatif. Machine Learning [stat.ML]. PSL Research University, 2017. Français. 〈NNT : 2017PSLEE062〉. 〈tel-01834967〉

Partager

Métriques

Consultations de la notice

198

Téléchargements de fichiers

45