Pénalités hiérarchiques pour l'intégration de connaissances dans les modèles statistiques

Marie Szafranski

Thèse Année : 2008

Hierarchical penalties for integrating prior knowledge in statistical models

Pénalités hiérarchiques pour l'intégration de connaissances dans les modèles statistiques

(1)

Marie Szafranski

Fonction : Auteur
PersonId : 15319
IdHAL : marie-szafranski
IdRef : 13679663X

Heuristique et Diagnostic des Systèmes Complexes [Compiègne]

Résumé

Supervised learning aims at predicting, but also analyzing or interpreting an observed phenomenon. Hierarchical penalization is a generic framework for integrating prior information in the fitting of statistical models. This prior information represents the relations shared by the characteristics of a given studied problem. In this thesis, the characteristics are organized in a two-levels tree structure, which defines distinct groups. The assumption is that few (groups of) characteristics are involved to discriminate between observations. Thus, for a learning problem, the goal is to identify relevant groups of characteristics, and at the same time, the significant characteristics within these groups. An adaptive penalization formulation is used to extract the significant components of each level. We show that the solution of this problem is equivalent to minimize a problem regularized by a mixed norm. These two approaches have been used to study the convexity and sparseness properties of the method. The latter is derived in parametric and non parametric function spaces. Experiences on brain-computer interfaces problems support our approach.

L'apprentissage statistique vise à prédire, mais aussi analyser ou interpréter un phénomène. Dans cette thèse, nous proposons de guider le processus d'apprentissage en intégrant une connaissance relative à la façon dont les caractéristiques d'un problème sont organisées. Cette connaissance est représentée par une structure arborescente à deux niveaux, ce qui permet de constituer des groupes distincts de caractéristiques. Nous faisons également l'hypothèse que peu de (groupes de) caractéristiques interviennent pour discriminer les observations. L'objectif est donc de faire émerger les groupes de caractéristiques pertinents, mais également les caractéristiques significatives associées à ces groupes. Pour cela, nous utilisons une formulation variationnelle de type pénalisation adaptative. Nous montrons que cette formulation conduit à minimiser un problème régularisé par une norme mixte. La mise en relation de ces deux approches offre deux points de vues pour étudier les propriétés de convexité et de parcimonie de cette méthode. Ces travaux ont été menés dans le cadre d'espaces de fonctions paramétriques et non paramétriques. L'intérêt de cette méthode est illustré sur des problèmes d'interfaces cerveaux-machines.

Mots clés

mixed norms variable and feature selection SVM kernel learning Supervized learning sparseness regularization

Apprentissage statistique supervisé parcimonie régularisation lasso normes mixtes sélection de variables et de caractéristiques Séparateurs à Vaste Marge (SVM) apprentissage de noyaux

Domaines

Autre [cs.OH] Mathématiques [math] Machine Learning [stat.ML]

Fichier principal

tel_szafranski_v2.pdf (1.49 Mo)

Marie Szafranski : Connectez-vous pour contacter le contributeur

https://theses.hal.science/tel-00369025

Soumis le : mardi 22 juin 2010-00:41:44

Dernière modification le : vendredi 24 mars 2023-14:52:53

Archivage à long terme le : jeudi 23 septembre 2010-12:46:18

Dates et versions

tel-00369025 , version 1 (18-03-2009)

tel-00369025 , version 2 (22-06-2010)

Identifiants

HAL Id : tel-00369025 , version 2

Citer

Marie Szafranski. Pénalités hiérarchiques pour l'intégration de connaissances dans les modèles statistiques. Autre [cs.OH]. Université de Technologie de Compiègne, 2008. Français. ⟨NNT : ⟩. ⟨tel-00369025v2⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

CNRS UNIV-COMPIEGNE INSMI HEUDIASYC RO

348 Consultations

661 Téléchargements

Hierarchical penalties for integrating prior knowledge in statistical models

Pénalités hiérarchiques pour l'intégration de connaissances dans les modèles statistiques

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager