Étude, proposition et validation d'une méthode de complétion utilisant les modèles d'apparition des valeurs manquantes - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2011

A Missing values completion method based on their appearing models

Étude, proposition et validation d'une méthode de complétion utilisant les modèles d'apparition des valeurs manquantes

Résumé

Knowledge Discovery from incomplete databases is a thriving research area. In this thesis, we particularly contribute with the prop osal of a missing values completion metho d. We start approaching this issue by de ning the app earing mo dels of the missing values. We prop ose a new typ ology according to the given data and we characterize these missing values in a non-redundant manner de ned by the basis of prop er implications. An algorithm computing this basis of rules, formalized from the hyp ergraph theory, is also develop ed in this thesis. We then explore the information provided during the characterization stage in order to prop ose a new contextual completion metho d which completes the missing values according to their typ e and to their context. The non-random missing values are completed with sp ecial values intrinsically containing the explanation de ned by the characterization schemes. Finally, we investigate the evaluation techniques of the missing values completion metho ds and we prop ose a new technique based on the stability of a clustering, when applied on reference data and completed ones.
L'extraction de connaissances à partir de données incomplètes constitue un axe de recherche en plein essor. Dans cette thèse, nous y contribuons par la proposition d'une méthode de complétion des valeurs manquantes. Nous commençons par aborder cette problématique par la définition de modèles d'apparition des valeurs manquantes. Nous en proposons une nouvelle typologie en fonction des données connues et nous les caractérisons de façon non redondante grâce à la base d'implications propres. Un algorithme de calcul de cette base de règles, formalisé à partir de la théorie des hypergraphes, est également proposé dans cette thèse. Ensuite, nous exploitons les informations fournies lors de l'étape de caractérisation afin de proposer une méthode de complétion contextualisée, qui complète les valeurs manquantes selon le type aléatoire/non-aléatoire et selon le contexte. La complétion des valeurs manquantes non aléatoires est effectuée par des valeurs spéciales, renfermant intrinsèquement les origines des valeurs manquantes et déterminées grâce à des schémas de caractérisation. Finalement, nous nous intéressons aux techniques d'évaluation des méthodes de complétion et nous proposons une nouvelle technique fondée sur la stabilité d'un clustering entre les données de référence et les données complétées.
Fichier principal
Vignette du fichier
These-Leila-BenOthman-2011.pdf.pdf (1.99 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-01017941 , version 1 (03-07-2014)

Identifiants

  • HAL Id : tel-01017941 , version 1

Citer

Leila Ben Othman. Étude, proposition et validation d'une méthode de complétion utilisant les modèles d'apparition des valeurs manquantes. Intelligence artificielle [cs.AI]. Université de Caen, 2011. Français. ⟨NNT : ⟩. ⟨tel-01017941⟩
382 Consultations
238 Téléchargements

Partager

Gmail Facebook X LinkedIn More