Apprentissage dans les espaces de grande dimension : Application à la caractérisation de tumeurs noires de la peau à partir d'images

Arthur Tenenhaus

Thèse Année : 2006

Learning in high dimensional data. Application to the characterization of black skin tumours from medical imaging

Apprentissage dans les espaces de grande dimension : Application à la caractérisation de tumeurs noires de la peau à partir d'images

(1, 2)

1
2

Arthur Tenenhaus

Fonction : Auteur
PersonId : 736979
IdHAL : arthur-tenenhaus
ORCID : 0000-0003-3459-1518
IdRef : 115337822

Laboratoire de Statistique Théorique et Appliquée

Laboratoire d'Imagerie Fonctionnelle

Résumé

The goal of the first part of the thesis is to define concepts allowing developing efficient classification tool for high dimensional data. In the second part of the thesis, we proposed methods based on supervised dimensionality reduction principle. These methods are based on PLS regression which is especially efficient when dealing with high dimensional data. In this context, we proposed a non-linear and binary classification tool, the Kernel Logistic PLS regression. It is based both on latent variables construction and learning with Kernel. We extend the Kernel Logistic PLS regression to the multiclass case, giving rise to the Kernel Logistic Multinomial PLS regression.
The two last chapters deal with applications such as melanoma detection from medical imaging or classfication of microarray data.

L'objectif de la thèse est de définir les bases conceptuelles permettant de développer des méthodes efficaces et adaptées à la classification dans les espaces de grande dimension. Dans ce contexte, les méthodes à noyau s'avèrent particulièrement adaptées. En effet, au-delà de leurs propriétés de régularisation - régularisation de type Tikhonov (Régression Ridge, Support Vector Machines, ... ) ou réduction de dimension (Partial Least Squares, Régression sur Composantes Principales,...) – elles offrent des avantages algorithmiques majeurs lorsque la dimension des données est supérieure au nombre d'observations. Ces méthodes ont fait l'objet d'une étude approfondie à la fois du point de vue théorique et appliqué dans les deux premiers chapitres de la thèse.

Les deux chapitres suivants proposent de nouvelles méthodes, découlant de cette étude. Elles se fondent sur des principes de réduction de dimension supervisée en se focalisant principalement sur la régression PLS, particulièrement bien adaptée à la gestion de données de grande dimension. Il s'agissait de concevoir des algorithmes de classification s'appuyant sur les principes algorithmiques de la régression PLS. Nous avons proposé, la Kernel Logistic PLS, modèle de classification nonlinéaire et binaire basé à la fois sur la construction de variables latentes et sur des transformations du type Empirical Kernel Map. Nous avons étendu la KL-PLS au cas où la variable à prédire est polytomique donnant naissance à la Kernel Multinomial Logistic PLS regression.
Enfin dans les deux derniers chapitres, nous avons appliqué ces méthodes à de nombreux domaines, notamment en analyse d'images. Nous avons ainsi contribué au développement d'une application en vraie grandeur dans le domaine médical en élaborant un outil d'aide au diagnostic de tumeurs noires de la peau à partir d'images.

Mots clés

statistics high dimension regularization kernel methods PLS regression dimensionality reduction

Statistique classification grande dimension apprentissage régularisation méthode à noyau réduction de dimension régression PLS

Domaines

Mathématiques [math]

Fichier principal

these_AT.pdf (8.17 Mo)

Arthur Tenenhaus : Connectez-vous pour contacter le contributeur

https://theses.hal.science/tel-00142439

Soumis le : jeudi 19 avril 2007-10:51:40

Dernière modification le : mardi 26 mars 2024-16:08:28

Archivage à long terme le : vendredi 21 septembre 2012-14:15:50

Dates et versions

tel-00142439 , version 1 (19-04-2007)

Identifiants

HAL Id : tel-00142439 , version 1

Citer

Arthur Tenenhaus. Apprentissage dans les espaces de grande dimension : Application à la caractérisation de tumeurs noires de la peau à partir d'images. Mathématiques [math]. Université Pierre et Marie Curie - Paris VI, 2006. Français. ⟨NNT : ⟩. ⟨tel-00142439⟩

Exporter

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

INSERM UPMC CNRS THESES-UPMC LSTA LIB LPSM SORBONNE-UNIVERSITE THESES-SU SU-SCIENCES

440 Consultations

740 Téléchargements

Learning in high dimensional data. Application to the characterization of black skin tumours from medical imaging

Apprentissage dans les espaces de grande dimension : Application à la caractérisation de tumeurs noires de la peau à partir d'images

Résumé

Mots clés

Domaines

Dates et versions

Identifiants

Citer

Exporter

Collections

Partager