Fouille de motifs : formalisation et unification

Résumé : Durant les deux dernières décennies, un travail considérable a été consacré aux aspects algorithmiques de la fouille de motifs fréquents, ce qui a donné naissance à un nombre phénoménal d'algorithmes et d'implémentations associées où chacun prétend la prééminence. Parallèlement, il est généralement admis par la communauté que le développement d'une théorie unificatrice est une des questions ouvertes et les plus intéressantes dans la sphère de recherche en fouille de données. Aussi, la première motivation de notre travail dans cette thèse est l'introduction d'un formalisme de haut niveau pour ce problème fondamental, qui induit une vision unifiée des approches algorithmiques développées jusque-là. Un des traits remarquables de notre modèle est qu'il prend en charge de manière intrinsèque les aspects à la fois qualitatifs et quantitatifs de ce problème basique, traités antérieurement toujours de manière séparée. En effet, nous formalisons ce problème à l'aide d'un modèle reposant sur les séries formelles. Après avoir encodé les motifs comme des mots sur un alphabet ordonné, nous exprimons ce problème par une série formelle sur le semi-anneau de comptage $(\N,+,\times,0,1)$, dont l'étendu représente les motifs et les coefficients sont leurs supports. L'objectif est triple : primo, la définition d'un cadre théorique clair, unifié et extensible à travers lequel nous pouvons reproduire les principales approches de fouille de motifs fréquents de l'état de l'art; secundo, la preuve d'un lien approprié entre la determinisation de l'automate à multiplicité représentant une base de transactions et le calcul de la collection associée de motifs fréquents; finalement, la mise en œuvre et l'évaluation d'une première implémentation, via des automates à multiplicités, de notre formalisme que nous baptisons \WAFI ~(pour Weighted Automata Frequent Itemset mining algorithm). Les résultats obtenus montrent le bien fondé et l'adéquation de notre modèle.
Type de document :
Thèse
Informatique [cs]. UATL (Algeria), 2018. Français
Liste complète des métadonnées

Littérature citée [73 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01760242
Contributeur : Slimane Oulad-Naoui <>
Soumis le : lundi 4 juin 2018 - 22:29:23
Dernière modification le : mardi 19 juin 2018 - 09:44:30

Fichier

ma these finale.pdf
Fichiers produits par l'(les) auteur(s)

Identifiants

  • HAL Id : tel-01760242, version 2

Citation

Slimane Oulad-Naoui. Fouille de motifs : formalisation et unification. Informatique [cs]. UATL (Algeria), 2018. Français. 〈tel-01760242v2〉

Partager

Métriques

Consultations de la notice

208

Téléchargements de fichiers

83