Pénalités hiérarchiques pour l'intégration de connaissances dans les modèles statistiques - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2008

Hierarchical penalties for integrating prior knowledge in statistical models

Pénalités hiérarchiques pour l'intégration de connaissances dans les modèles statistiques

Résumé

Supervised learning aims at predicting, but also analyzing or interpreting an observed phenomenon. Hierarchical penalization is a generic framework for integrating prior information in the fitting of statistical models. This prior information represents the relations shared by the characteristics of a given studied problem. In this thesis, the characteristics are organized in a two-levels tree structure, which defines distinct groups. The assumption is that few (groups of) characteristics are involved to discriminate between observations. Thus, for a learning problem, the goal is to identify relevant groups of characteristics, and at the same time, the significant characteristics within these groups. An adaptive penalization formulation is used to extract the significant components of each level. We show that the solution of this problem is equivalent to minimize a problem regularized by a mixed norm. These two approaches have been used to study the convexity and sparseness properties of the method. The latter is derived in parametric and non parametric function spaces. Experiences on brain-computer interfaces problems support our approach.
L'apprentissage statistique vise à prédire, mais aussi analyser ou interpréter un phénomène. Dans cette thèse, nous proposons de guider le processus d'apprentissage en intégrant une connaissance relative à la façon dont les caractéristiques d'un problème sont organisées. Cette connaissance est représentée par une structure arborescente à deux niveaux, ce qui permet de constituer des groupes distincts de caractéristiques. Nous faisons également l'hypothèse que peu de (groupes de) caractéristiques interviennent pour discriminer les observations. L'objectif est donc de faire émerger les groupes de caractéristiques pertinents, mais également les caractéristiques significatives associées à ces groupes. Pour cela, nous utilisons une formulation variationnelle de type pénalisation adaptative. Nous montrons que cette formulation conduit à minimiser un problème régularisé par une norme mixte. La mise en relation de ces deux approches offre deux points de vues pour étudier les propriétés de convexité et de parcimonie de cette méthode. Ces travaux ont été menés dans le cadre d'espaces de fonctions paramétriques et non paramétriques. L'intérêt de cette méthode est illustré sur des problèmes d'interfaces cerveaux-machines.
Fichier principal
Vignette du fichier
tel_szafranski_v2.pdf (1.49 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00369025 , version 1 (18-03-2009)
tel-00369025 , version 2 (22-06-2010)

Identifiants

  • HAL Id : tel-00369025 , version 2

Citer

Marie Szafranski. Pénalités hiérarchiques pour l'intégration de connaissances dans les modèles statistiques. Autre [cs.OH]. Université de Technologie de Compiègne, 2008. Français. ⟨NNT : ⟩. ⟨tel-00369025v2⟩
348 Consultations
661 Téléchargements

Partager

Gmail Facebook X LinkedIn More