Contributions de l'inférence grammaticale à la fouille de données séquentielles - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Contributions of grammatical inference to sequential pattern mining

Contributions de l'inférence grammaticale à la fouille de données séquentielles

Stéphanie Jacquemont
  • Fonction : Auteur
  • PersonId : 864667

Résumé

Within the framework of this thesis, we established links between the models obtained by grammatical inference algorithms and the knowledge inferred by sequential data mining algorithms. Based on the observation that the common point between these two different contexts is the manipulation of data structured in the form of sequences of symbols, we tried to exploit the properties of probabilistic automaton inferred from these sequences for the benefit of a more efficient sequential data mining.

In this context, we showed that the raw exploitation, not only of original sequences but also of probabilistic automaton inferred from those, does not necessarily guarantee an extraction of relevant knowledge. We bring in this thesis several contributions, under the shape of minimal borders and statistical constraints, so allowing to insure a fruitful exploitation of sequences and probabilistic automaton. Furthermore, thanks to our model we bring an effective solution for applications which bringing problems of preservation of private individuals life into play.
Dans le cadre de cette thèse, nous avons établi des liens entre les modèles obtenus par des algorithmes d'inférence grammaticale et la connaissance induite par des techniques de fouille de données séquentielles. Partant du constat que le point commun entre ces deux contextes différents de travail est la manipulation de données structurées sous forme de séquences de symboles, nous avons tenté d'exploiter les propriétés des automates probabilistes inférés à partir de ces séquences au profit d'une fouille de données séquentielles plus efficace.
Dans ce contexte, nous avons montré que l'exploitation brute, non seulement des séquences d'origine mais aussi des automates probabilistes inférés à partir de celles-ci, ne garantit pas forcément une extraction de connaissance pertinente. Nous avons apporté dans cette thèse plusieurs contributions, sous la forme de bornes minimales et de contraintes statistiques, permettant ainsi d'assurer une exploitation fructueuse des séquences et des automates probabilistes. De plus, grâce à notre modèle nous apportons une solution efficace à certaines applications mettant en jeux des problèmes de préservation de vie privée des individus.
Fichier principal
Vignette du fichier
these.pdf (2.19 Mo) Télécharger le fichier

Dates et versions

tel-00366358 , version 1 (06-03-2009)

Identifiants

  • HAL Id : tel-00366358 , version 1

Citer

Stéphanie Jacquemont. Contributions de l'inférence grammaticale à la fouille de données séquentielles. Interface homme-machine [cs.HC]. Université Jean Monnet - Saint-Etienne, 2008. Français. ⟨NNT : ⟩. ⟨tel-00366358⟩
136 Consultations
312 Téléchargements

Partager

Gmail Facebook X LinkedIn More