Un cadre générique de découverte de motifs sous contraintes fondées sur des primitives - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

A generic framework for discovering patterns under primitive-based constraints.

Un cadre générique de découverte de motifs sous contraintes fondées sur des primitives

Résumé

Pattern mining is a significant field of Knowledge Discovery in
Databases. This thesis deals with the mining problem of local patterns
under constraints. We propose a new framework relying on monotone
primitives in order to define and mine varied constraints. This broad
spectrum of constraints enables users to accurately focus on the most
interesting patterns. We provide two main approaches for automatically
mining patterns which solve the intrinsic algorithmic difficulty of
this task. Their efficiency mainly relies on necessary conditions
approximating the variation of contraints. Firstly, relaxing methods
enable us to re-use numerous usual algorithms. Secondly, we design
pattern mining algorithms dedicated to wide or correlated datasets by
exploiting the concept of equivalence classes. Finally, the use of
these methods highlights several relevant local phenomena in real
industrial and medical applications.
La découverte de motifs est une tâche centrale pour
l'extraction de connaissances dans les bases de données. Cette thèse
traite de l'extraction de motifs locaux sous contraintes. Nous
apportons un éclairage nouveau avec un cadre combinant des primitives
monotones pour définir des contraintes quelconques. La variété de ces
contraintes exprime avec précision l'archétype des motifs recherchés
par l'utilisateur au sein d'une base de données. Nous proposons alors
deux types d'approche d'extraction automatique et générique malgré les
difficultés algorithmiques inhérentes à cette tâche. Leurs efficacités
reposent principalement sur l'usage de conditions nécessaires pour
approximer les variations de la contrainte. D'une part, des méthodes
de relaxations permettent de ré-utiliser les nombreux algorithmes
usuels du domaines. D'autre part, nous réalisons des méthodes
d'extraction directes dédiées aux motifs ensemblistes pour les données
larges ou corrélées en exploitant des classes d'équivalences. Enfin,
l'utilisation de nos méthodes ont permi la découverte de phénomènes
locaux lors d'applications industrielles et médicales.
Fichier principal
Vignette du fichier
theseSoulet.pdf (1.43 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00123185 , version 1 (08-01-2007)

Identifiants

  • HAL Id : tel-00123185 , version 1

Citer

Arnaud Soulet. Un cadre générique de découverte de motifs sous contraintes fondées sur des primitives. Autre [cs.OH]. Université de Caen, 2006. Français. ⟨NNT : ⟩. ⟨tel-00123185⟩
218 Consultations
360 Téléchargements

Partager

Gmail Facebook X LinkedIn More