A closed patterns-based approach to the consensus clustering problem

Atheer Al-Najdi 1
1 Laboratoire d'Informatique, Signaux, et Systèmes de Sophia-Antipolis (I3S) / Projet MinD
SPARKS - Scalable and Pervasive softwARe and Knowledge Systems
Résumé : Le clustering est le processus de partitionnement d’un ensemble de données en groupes, de sorte que les instances du même groupe sont plus semblables les unes aux autres qu’avec celles de tout autre groupe. De nombreux algorithmes de clustering ont été proposés, mais aucun d’entre eux ne s’avère fournir une partitiondes données pertinente dans toutes les situations. Le clustering par consensus vise à améliorer le processus de regroupement en combinant différentes partitions obtenues à partir de divers algorithmes afin d’obtenir une solution de consensus de meilleure qualité. Dans ce travail, une nouvelle méthode de clustering par consensus, appelée MultiCons, est proposée. Cette méthode utilise la technique d’extraction des itemsets fréquents fermés dans le but de découvrir les similitudes entre les différentes solutions de clustering dits de base. Les similitudes identifiées sont représentées sous une forme de motifs de clustering, chacun définissant un accord entre un ensemble de clusters de bases sur le regroupement d’un ensemble d’instances. En traitant ces motifs par groupes, en fonction du nombre de clusters de base qui définissent le motif, la méthode MultiCons génère une solution de consensus pour chaque groupe, générant par conséquence plusieurs consensus candidats. Ces différentes solutions sont ensuite représentées dans une structure arborescente appelée arbre de consensus, ouConsTree. Cette représentation graphique facilite la compréhension du processus de construction des multiples consensus, ainsi que les relations entre les instances et les structures d’instances dans l’espace de données
Type de document :
Thèse
Other [cs.OH]. Université Côte d'Azur, 2016. English. 〈NNT : 2016AZUR4111〉
Liste complète des métadonnées

Littérature citée [62 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01478626
Contributeur : Abes Star <>
Soumis le : mardi 28 février 2017 - 11:37:22
Dernière modification le : lundi 10 juillet 2017 - 10:50:24
Document(s) archivé(s) le : lundi 29 mai 2017 - 13:30:24

Fichier

2016AZUR4111.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01478626, version 1

Collections

STAR | UNICE | I3S

Citation

Atheer Al-Najdi. A closed patterns-based approach to the consensus clustering problem. Other [cs.OH]. Université Côte d'Azur, 2016. English. 〈NNT : 2016AZUR4111〉. 〈tel-01478626〉

Partager

Métriques

Consultations de
la notice

137

Téléchargements du document

169