Incremental Bayesian network structure learning from data streams

Résumé : Dans la dernière décennie, l’extraction du flux de données est devenu un domaine de recherche très actif. Les principaux défis pour les algorithmes d’analyse de flux sont de gérer leur infinité, de s’adapter au caractère non stationnaire des distributions de probabilités sous-jacentes, et de fonctionner sans relecture. Par conséquent, les techniques traditionnelles de fouille ne peuvent s’appliquer directement aux flux de données. Le problème s’intensifie pour les flux dont les domaines sont de grande dimension tels que ceux provenant des réseaux sociaux, avec plusieurs centaines voire milliers de variables. Pour rester a jour, les algorithmes d’apprentissage de réseaux Bayésiens doivent pouvoir intégrer des données nouvelles en ligne. L’état de l’art en la matiere implique seulement plusieurs dizaines de variables et ces algorithmes ne fonctionnent pas correctement pour des dimensions supérieures. Ce travail est une contribution au problème d’apprentissage de structure de réseau Bayésien en ligne pour des domaines de haute dimension, et a donné lieu à plusieurs propositions. D’abord, nous avons proposé une approche incrémentale de recherche locale, appelée iMMPC. Ensuite, nous avons proposé une version incrémentale de l’algorithme MMHC pour apprendre la structure du réseau. Nous avons également adapté cet algorithme avec des mécanismes de fenêtre glissante et une pondération privilégiant les données nouvelles. Enfin, nous avons démontré la faisabilité de notre approche par de nombreuses expériences sur des jeux de données synthétiques.
Type de document :
Thèse
Machine Learning [cs.LG]. Université de Nantes, 2013. English
Liste complète des métadonnées

Littérature citée [136 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01284332
Contributeur : Lina Duke <>
Soumis le : lundi 7 mars 2016 - 14:46:35
Dernière modification le : jeudi 10 mars 2016 - 01:06:47
Document(s) archivé(s) le : mercredi 8 juin 2016 - 14:41:56

Identifiants

  • HAL Id : tel-01284332, version 1

Collections

Citation

Amanullah Yasin. Incremental Bayesian network structure learning from data streams. Machine Learning [cs.LG]. Université de Nantes, 2013. English. 〈tel-01284332〉

Partager

Métriques

Consultations de la notice

169

Téléchargements de fichiers

813