Skip to Main content Skip to Navigation
Theses

Fouille de motifs : formalisation et unification

Résumé : Durant les deux dernières décennies, un travail considérable a été consacré aux aspects algorithmiques de la fouille de motifs fréquents, ce qui a donné naissance à un nombre phénoménal d'algorithmes et d'implémentations associées où chacun prétend la prééminence. Parallèlement, il est généralement admis par la communauté que le développement d'une théorie unificatrice est une des questions ouvertes et les plus intéressantes dans la sphère de recherche en fouille de données. Aussi, la première motivation de notre travail dans cette thèse est l'introduction d'un formalisme de haut niveau pour ce problème fondamental, qui induit une vision unifiée des approches algorithmiques développées jusque-là. Un des traits remarquables de notre modèle est qu'il prend en charge de manière intrinsèque les aspects à la fois qualitatifs et quantitatifs de ce problème basique, traités antérieurement toujours de manière séparée. En effet, nous formalisons ce problème à l'aide d'un modèle reposant sur les séries formelles. Après avoir encodé les motifs comme des mots sur un alphabet ordonné, nous exprimons ce problème par une série formelle sur le semi-anneau de comptage $(\N,+,\times,0,1)$, dont l'étendu représente les motifs et les coefficients sont leurs supports. L'objectif est triple : primo, la définition d'un cadre théorique clair, unifié et extensible à travers lequel nous pouvons reproduire les principales approches de fouille de motifs fréquents de l'état de l'art; secundo, la preuve d'un lien approprié entre la determinisation de l'automate à multiplicité représentant une base de transactions et le calcul de la collection associée de motifs fréquents; finalement, la mise en œuvre et l'évaluation d'une première implémentation, via des automates à multiplicités, de notre formalisme que nous baptisons \WAFI ~(pour Weighted Automata Frequent Itemset mining algorithm). Les résultats obtenus montrent le bien fondé et l'adéquation de notre modèle.
Document type :
Theses
Complete list of metadatas

Cited literature [185 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01760242
Contributor : Slimane Oulad-Naoui <>
Submitted on : Friday, April 6, 2018 - 10:29:01 AM
Last modification on : Friday, March 15, 2019 - 3:36:19 PM

File

ma these finale.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-01760242, version 1

Citation

Slimane Oulad-Naoui. Fouille de motifs : formalisation et unification. Informatique [cs]. UATL (Algeria), 2018. Français. ⟨tel-01760242v1⟩

Share

Metrics

Record views

105

Files downloads

148