Symbolic Data Mining Methods with the Coron Platform - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

Symbolic Data Mining Methods with the Coron Platform

Méthodes symboliques de fouille de données avec la plate-forme Coron

Laszlo Szathmary
  • Fonction : Auteur
  • PersonId : 854702

Résumé

The main topic of this thesis is knowledge discovery in databases (KDD). More precisely, we have investigated two of the most important tasks of KDD today, namely itemset extraction and association rule generation. Throughout our work we have borne in mind that our goal is to find interesting association rules from various points of view: for efficient mining purposes, for minimizing the set of extracted rules and for finding intelligible (and easily interpretable) knowledge units. We have developed and adapted specific algorithms in order to achieve this goal.
The main contributions of this thesis are: (1) We have developed and adapted algorithms for finding minimal non-redundant association rules; (2) We have defined a new basis for association rules called Closed Rules; (3) We have investigated an important but relatively unexplored field of KDD namely the extraction of rare itemsets and rare association rules; (4) We have packaged our algorithms and a collection of other algorithms along with other auxiliary operations for KDD into a unified software toolkit called Coron.
Le sujet principal de cette thèse est l'extraction de connaissances dans les bases de données (ECBD). Plus précisément, nous avons étudié deux des plus importantes tâches d'ECBD actuelles, qui sont l'extraction de motifs et la génération de règles d'association. Tout au long de notre travail, notre objectif a été de trouver des règles d'associations intéressantes selon plusieurs points de vue : dans un but de fouille efficace, pour réduire au minimum l'ensemble des règles extraites et pour trouver des unités de connaissances intelligibles (et facilement interprétables). Pour atteindre ce but, nous avons développé et adapté des algorithmes spécifiques.
Les contributions principales de cette thèse sont : (1) nous avons développé et adapté des algorithmes pour trouver les règles d'association minimales non-redondantes ; (2) nous avons défini une nouvelle base pour les règles d'associations appelée “règles fermées” ; (3) nous avons étudié un champ de l'ECBD important mais relativement peu étudié, à savoir l'extraction des motifs rares et des règles d'association rares ; (4) nous avons regroupé nos algorithmes et une collection d'autres algorithmes ainsi que d'autres opérations auxiliaires d'ECBD dans une boîte à outils logicielle appelée Coron.
Fichier principal
Vignette du fichier
szathmary-thesis06.pdf (2.31 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01754284 , version 2 (03-11-2008)
tel-01754284 , version 1 (30-03-2018)

Identifiants

  • HAL Id : tel-01754284 , version 2

Citer

Laszlo Szathmary. Symbolic Data Mining Methods with the Coron Platform. Software Engineering [cs.SE]. Université Henri Poincaré - Nancy 1, 2006. English. ⟨NNT : 2006NAN10159⟩. ⟨tel-01754284v2⟩
483 Consultations
1356 Téléchargements

Partager

Gmail Facebook X LinkedIn More