Un algorithme de fouille de données générique et parallèle pour architecture multi-coeurs

Benjamin Negrevergne 1, 2
1 MESCAL - Middleware efficiently scalable
Inria Grenoble - Rhône-Alpes, LIG - Laboratoire d'Informatique de Grenoble
Résumé : Dans le domaine de l'extraction de motifs, il existe un grand nombre d'algorithmes pour résoudre une large variété de sous problèmes sensiblement identiques. Cette variété d'algorithmes freine l'adoption des techniques d'extraction de motifs pour l'analyse de données. Dans cette thèse, nous proposons un formalisme qui permet de capturer une large gamme de problèmes d'extraction de motifs. Pour démontrer la généralité de ce formalisme, nous l'utilisons pour décrire trois problèmes d'extraction de motifs : le problème d'extraction d'itemsets fréquents fermés, le problème d'extraction de graphes relationnels fermés ou le problème d'extraction d'itemsets graduels fermés. Ce formalisme nous permet de construire ParaMiner qui est un algorithme générique et parallèle pour les problèmes d'extraction de motifs. ParaMiner est capable de résoudre tous les problèmes d'extraction de motifs qui peuvent ˆtre décrit dans notre formalisme. Pour obtenir de bonne performances, nous avons généralisé plusieurs optimisations proposées par la communauté dans le cadre de problèmes spécifique d'extraction de motifs. Nous avons également exploité la puissance de calcul parallèle disponible dans les archi- tectures parallèles. Nos expériences démontrent qu'en dépit de la généricité de ParaMiner ses performances sont comparables avec celles obtenues par les algorithmes les plus rapides de l'état de l'art. Ces algorithmes bénéficient pourtant d'un avantage important, puisqu'ils incorporent de nombreuses optimisations spécifiques au sous problème d'extraction de motifs qu'ils résolvent.
Type de document :
Thèse
Autre [cs.OH]. Université de Grenoble, 2011. Français. 〈NNT : 2011GRENM062〉
Liste complète des métadonnées

Littérature citée [58 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00680025
Contributeur : Abes Star <>
Soumis le : samedi 17 mars 2012 - 10:02:26
Dernière modification le : jeudi 11 octobre 2018 - 08:48:02
Document(s) archivé(s) le : lundi 18 juin 2012 - 17:02:20

Fichier

negrevergne_benjamin_2011_arch...
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-00680025, version 1

Collections

Citation

Benjamin Negrevergne. Un algorithme de fouille de données générique et parallèle pour architecture multi-coeurs. Autre [cs.OH]. Université de Grenoble, 2011. Français. 〈NNT : 2011GRENM062〉. 〈tel-00680025〉

Partager

Métriques

Consultations de la notice

1199

Téléchargements de fichiers

711