Techniques d'optimisation pour la fouille de données

Résumé : Les technologies numériques ont engendré depuis peu, des volumes de données importants, qui peuvent receler des informations utiles. Ceci a donné naissance à l'extraction de connaissances à partir des données qui désigne le processus d'extraction d'informations implicites, précédemment inconnues et potentiellement utiles enfouies dans les données. La fouille de données comprend cinq phases dont la principale est l'extraction de modèles. Nous nous intéressons aux connaisances exprimées sous la forme de règles de dépendance et à la qualité de ces règles. Une règle de dépendance est une implication conditionnelle entre ensembles d'attributs. Les algorithmes standard ont pour but de rechercher les meilleurs modèles. Derrière ces processus se cache en fait une véritable problématique d'optimisation. Nous considérons la recherche des règles de dépendance les plus intéressantes comme étant un problème d'optimisation dans lequel la qualité d'une règle est quantifiée par des mesures. Ainsi, il convient d'étudier les espaces de recherche induits par les mesures ainsi que les algorithmes de recherche dans ces espaces. Il ressort que la plupart des mesures observées présentent des propriétés différentes suivant le jeu de données. Une approche analytique n'est donc pas envisageable dans fixer certains paramères. Nous observons les variations relatives de mesures évaluées simultanément ; certaines d'entre elles sont antagonistes ce qui ne permet pas d'obtenir "la" meilleure règle ; il faut alors considérer un ensemble de compromis satisfaisants. Nous apportons des solutions par le biais des algorithmes génétiques.
Type de document :
Thèse
Interface homme-machine [cs.HC]. Université Nice Sophia Antipolis, 2004. Français
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00216131
Contributeur : Estelle Nivault <>
Soumis le : jeudi 24 janvier 2008 - 15:29:51
Dernière modification le : jeudi 24 janvier 2008 - 15:58:16
Document(s) archivé(s) le : jeudi 15 avril 2010 - 02:44:26

Identifiants

  • HAL Id : tel-00216131, version 1

Collections

Citation

Dominique Francisci. Techniques d'optimisation pour la fouille de données. Interface homme-machine [cs.HC]. Université Nice Sophia Antipolis, 2004. Français. 〈tel-00216131〉

Partager

Métriques

Consultations de
la notice

260

Téléchargements du document

269