Apprentissage dans les espaces de grande dimension : Application à la caractérisation de tumeurs noires de la peau à partir d'images - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

Learning in high dimensional data. Application to the characterization of black skin tumours from medical imaging

Apprentissage dans les espaces de grande dimension : Application à la caractérisation de tumeurs noires de la peau à partir d'images

Résumé

The goal of the first part of the thesis is to define concepts allowing developing efficient classification tool for high dimensional data. In the second part of the thesis, we proposed methods based on supervised dimensionality reduction principle. These methods are based on PLS regression which is especially efficient when dealing with high dimensional data. In this context, we proposed a non-linear and binary classification tool, the Kernel Logistic PLS regression. It is based both on latent variables construction and learning with Kernel. We extend the Kernel Logistic PLS regression to the multiclass case, giving rise to the Kernel Logistic Multinomial PLS regression.
The two last chapters deal with applications such as melanoma detection from medical imaging or classfication of microarray data.
L'objectif de la thèse est de définir les bases conceptuelles permettant de développer des méthodes efficaces et adaptées à la classification dans les espaces de grande dimension. Dans ce contexte, les méthodes à noyau s'avèrent particulièrement adaptées. En effet, au-delà de leurs propriétés de régularisation - régularisation de type Tikhonov (Régression Ridge, Support Vector Machines, ... ) ou réduction de dimension (Partial Least Squares, Régression sur Composantes Principales,...) – elles offrent des avantages algorithmiques majeurs lorsque la dimension des données est supérieure au nombre d'observations. Ces méthodes ont fait l'objet d'une étude approfondie à la fois du point de vue théorique et appliqué dans les deux premiers chapitres de la thèse.

Les deux chapitres suivants proposent de nouvelles méthodes, découlant de cette étude. Elles se fondent sur des principes de réduction de dimension supervisée en se focalisant principalement sur la régression PLS, particulièrement bien adaptée à la gestion de données de grande dimension. Il s'agissait de concevoir des algorithmes de classification s'appuyant sur les principes algorithmiques de la régression PLS. Nous avons proposé, la Kernel Logistic PLS, modèle de classification nonlinéaire et binaire basé à la fois sur la construction de variables latentes et sur des transformations du type Empirical Kernel Map. Nous avons étendu la KL-PLS au cas où la variable à prédire est polytomique donnant naissance à la Kernel Multinomial Logistic PLS regression.
Enfin dans les deux derniers chapitres, nous avons appliqué ces méthodes à de nombreux domaines, notamment en analyse d'images. Nous avons ainsi contribué au développement d'une application en vraie grandeur dans le domaine médical en élaborant un outil d'aide au diagnostic de tumeurs noires de la peau à partir d'images.
Fichier principal
Vignette du fichier
these_AT.pdf (8.17 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00142439 , version 1 (19-04-2007)

Identifiants

  • HAL Id : tel-00142439 , version 1

Citer

Arthur Tenenhaus. Apprentissage dans les espaces de grande dimension : Application à la caractérisation de tumeurs noires de la peau à partir d'images. Mathématiques [math]. Université Pierre et Marie Curie - Paris VI, 2006. Français. ⟨NNT : ⟩. ⟨tel-00142439⟩
440 Consultations
740 Téléchargements

Partager

Gmail Facebook X LinkedIn More