Utilisation des modèles de co-clustering pour l'analyse exploratoire des données

Résumé : Le co-clustering est une technique de classification consistant à réaliser une partition simultanée des lignes et des colonnes d'une matrice de données. Parmi les approches existantes, MODL permet de traiter des données volumineuses et de réaliser une partition de plusieurs variables, continues ou nominales. Nous utilisons cette approche comme référence dans l'ensemble des travaux de la thèse et montrons la diversité des problèmes de data mining pouvant être traités, comme le partitionnement de graphes, de graphes temporels ou encore le clustering de courbes. L'approche MODL permet d'obtenir des résultats fins sur des données volumineuses, ce qui les rend difficilement interprétables. Des outils d'analyse exploratoire sont alors nécessaires pour les exploiter. Afin de guider l'utilisateur dans l'interprétation de tels résultats, nous définissons plusieurs outils consistant à simplifier des résultats fins afin d'en avoir une interprétation globale, à détecter les clusters remarquables, à déterminer les valeurs représentatives de leurs clusters et enfin à visualiser les résultats. Les comportements asymptotiques de ces outils d'analyse exploratoire sont étudiés afin de faire le lien avec les approches existantes. Enfin une application sur des comptes-rendus d'appels de l'opérateur Orange, collectés en Côte d'Ivoire, montre l'intérêt de l'approche et des outils d'analyse exploratoire dans un contexte industriel.
Type de document :
Thèse
Applications [stat.AP]. Université Panthéon-Sorbonne - Paris I, 2013. Français
Liste complète des métadonnées

Littérature citée [111 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00935278
Contributeur : Romain Guigourès <>
Soumis le : jeudi 23 janvier 2014 - 12:20:23
Dernière modification le : samedi 7 février 2015 - 21:38:46
Document(s) archivé(s) le : jeudi 24 avril 2014 - 02:20:15

Identifiants

  • HAL Id : tel-00935278, version 1

Citation

Romain Guigourès. Utilisation des modèles de co-clustering pour l'analyse exploratoire des données. Applications [stat.AP]. Université Panthéon-Sorbonne - Paris I, 2013. Français. 〈tel-00935278〉

Partager

Métriques

Consultations de
la notice

611

Téléchargements du document

4048