De l'identification de structure de réseaux bayésiens à la reconnaissance de formes à partir d'informations complètes ou incomplètes. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

Bayesian Network Identification from Complete or Incomplete Datasets.

De l'identification de structure de réseaux bayésiens à la reconnaissance de formes à partir d'informations complètes ou incomplètes.

Résumé

We have performed an empirical study of various deterministic Bayesian
networks structure learning algorithms.
The first test step has allowed us to emphasise which learning
technics need a specific initialisation et we have proposed a way to
do this.
In the second stage of this doctoral study, we have adapted some
learning technics to incomplete datasets.
Then, we have proposed an efficient algorithm to learn a
tree-augmented naive Bayes classifier in a general way from an
incomplete dataset.
We have also introduced an original formalism to model incomplete
dataset generation processes with MCAR or MAR assumptions.
Finally, various synthetic datasets and real datasets have been used
to empirically compare structure learning methods from incomplete
datasets.
Durant ces travaux de thèse, une comparaison empirique de différentes
techniques d'apprentissage de structure de réseaux bayésiens a été
effectuée, car même s'il peut en exister très ponctuellement, il
n'existe pas de comparaisons plus globales de ces algorithmes.
De multiples phases de tests nous ont permis d'identifier quelles
méthodes souffraient de difficultés d'initialisation et nous avons
proposé une technique pour les résoudre.
Nous avons ensuite adapté différentes méthodes d'apprentissage de
structure aux bases de données incomplètes et avons notamment
introduit une technique pour apprendre efficacement une structure arborescente.
Cette méthode est ensuite adaptée à la problématique plus spécifique
de la classification et permet d'apprendre efficacement et en toute
généralité un classifieur de Bayes Naïf augmenté.
Un formalisme original permettant de générer des bases de données
incomplètes ayant des données manquantes vérifiant les hypothèses MCAR
ou MAR est également introduit.
De nombreuses bases synthétiques ou réelles ont alors été utilisées
pour tester ces méthodes d'apprentissage de structure à partir de
bases incomplètes.
Fichier principal
Vignette du fichier
these.pdf (3.29 Mo) Télécharger le fichier

Dates et versions

tel-00126033 , version 1 (23-01-2007)

Identifiants

  • HAL Id : tel-00126033 , version 1

Citer

Olivier Francois. De l'identification de structure de réseaux bayésiens à la reconnaissance de formes à partir d'informations complètes ou incomplètes.. Modélisation et simulation. INSA de Rouen, 2006. Français. ⟨NNT : ⟩. ⟨tel-00126033⟩
189 Consultations
3756 Téléchargements

Partager

Gmail Facebook X LinkedIn More