Conception et validation d'une méthode de complétion des valeurs manquantes fondée sur leurs modèles d'apparition

Leila Ben Othman 1
1 Equipe CODAG - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
Résumé : L'extraction de connaissances à partir de données incomplètes constitue un axe de recherche en plein essor. Dans cette thèse, nous y contribuons par la proposition d'une méthode de complétion des valeurs manquantes. Nous commençons par aborder cette problématique par la définition de modèles d'apparition des valeurs manquantes. Nous en proposons une nouvelle typologie en fonction des données connues et nous les caractérisons de façon non redondante grâce à la base d'implications propres. Un algorithme de calcul de cette base de règles, formalisé à partir de la théorie des hypergraphes, est également proposé dans cette thèse. Ensuite, nous exploitons les informations fournies lors de l'étape de caractérisation afin de proposer une méthode de complétion contextualisée, qui complète les valeurs manquantes selon le type aléatoire/non-aléatoire et selon le contexte. La complétion des valeurs manquantes non aléatoires est effectuée par des valeurs spéciales, renfermant intrinsèquement les origines des valeurs manquantes et déterminées grâce à des schémas de caractérisation. Finalement, nous nous intéressons aux techniques d'évaluation des méthodes de complétion et nous proposons une nouvelle technique fondée sur la stabilité d'un clustering entre les données de référence et les données complétées.
Type de document :
Thèse
Artificial Intelligence. Université de Caen, 2011. French


https://tel.archives-ouvertes.fr/tel-01017941
Contributeur : Greyc Référent <>
Soumis le : jeudi 3 juillet 2014 - 14:16:23
Dernière modification le : vendredi 23 janvier 2015 - 01:09:21

Identifiants

  • HAL Id : tel-01017941, version 1

Collections

Citation

Leila Ben Othman. Conception et validation d'une méthode de complétion des valeurs manquantes fondée sur leurs modèles d'apparition. Artificial Intelligence. Université de Caen, 2011. French. <tel-01017941>

Exporter

Partager

Métriques

Consultation de
la notice

109

Téléchargement du document

35