Generalizing association rules in n-ary relations : application to dynamic graph analysis

Résumé : Le calcul de motifs dans de grandes relations binaires a été très étudié. Un succès emblématique concerne la découverte d'ensembles fréquents et leurs post-traitements pour en dériver des règles d'association. Il s'agit de calculer des motifs dans des relations binaires qui enregistrent quelles sont les propriétés satisfaites par des objets. En fait, de nombreux jeux de données se présentent naturellement comme des relations n-aires (avec n > 2). Par exemple, avec l'ajout de dimensions spatiales et/ou temporelles (lieux et/ou temps où les propriétés sont enregistrées), la relation binaire Objets x Propriétés est étendue à une relation 4-aire Objets x Propriétés x Lieux x Temps. Nous avons généralisé le concept de règle d'association dans un tel contexte multi-dimensionnel. Contrairement aux règles usuelles qui n'impliquent que des sous-ensembles d'un seul domaine de la relation, les prémisses et les conclusions de nos règles peuvent impliquer des sous-ensembles arbitraires de certains domaines. Nous avons conçu des mesures de fréquence et de confiance pour définir la sémantique de telles règles et c'est une contribution significative de cette thèse. Le calcul exhaustif de toutes les règles qui ont des fréquences et confiances suffisantes et l'élimination des règles redondantes ont été étudiés. Nous proposons ensuite d'introduire des disjonctions dans les conclusions des règles, ce qui nécessite de retravailler les définitions des mesures d'intérêt et les questions de redondance. Pour ouvrir un champ d'application original, nous considérons la découverte de règles dans des graphes relationnels dynamiques qui peuvent être codés dans des relations n-aires (n ≥ 3). Une application à l'analyse des usages de bicyclettes dans le système Vélo'v (système de Vélos en libre-service du Grand Lyon) montre quelques usages possibles des règles que nous savons calculer avec nos prototypes logiciels.
Type de document :
Thèse
Other [cs.OH]. INSA de Lyon, 2012. English. <NNT : 2012ISAL0094>
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00995132
Contributeur : Abes Star <>
Soumis le : jeudi 22 mai 2014 - 17:42:08
Dernière modification le : mercredi 13 janvier 2016 - 10:06:40
Document(s) archivé(s) le : vendredi 22 août 2014 - 13:30:47

Fichier

these.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-00995132, version 1

Collections

Citation

Thi Kim Ngan Nguyen. Generalizing association rules in n-ary relations : application to dynamic graph analysis. Other [cs.OH]. INSA de Lyon, 2012. English. <NNT : 2012ISAL0094>. <tel-00995132>

Partager

Métriques

Consultations de
la notice

205

Téléchargements du document

334