Sparse coding for machine learning, image processing and computer vision

Julien Mairal

Theses Year : 2010

Sparse coding for machine learning, image processing and computer vision

Représentations parcimonieuses en apprentissage statistique, traitement d’image et vision par ordinateur

(1)

Julien Mairal

Function : Author
PersonId : 1034832
ORCID : 0000-0001-6991-2110
IdRef : 152125256

Laboratoire d'informatique de l'école normale supérieure

Abstract

We study in this thesis a particular machine learning approach to represent signals that that consists of modelling data as linear combinations of a few elements from a learned dictionary. It can be viewed as an extension of the classical wavelet framework, whose goal is to design such dictionaries (often orthonormal basis) that are adapted to natural signals. An important success of dictionary learning methods has been their ability to model natural image patches and the performance of image denoising algorithms that it has yielded. We address several open questions related to this framework: How to efficiently optimize the dictionary? How can the model be enriched by adding a structure to the dictionary? Can current image processing tools based on this method be further improved? How should one learn the dictionary when it is used for a different task than signal reconstruction? How can it be used for solving computer vision problems? We answer these questions with a multidisciplinarity approach, using tools from statistical machine learning, convex and stochastic optimization, image and signal processing, computer vision, but also optimization on graphs.

Nous étudions dans cette thèse une représentation particulière de signaux fondée sur une méthode d’apprentissage statistique, qui consiste à modéliser des données comme combinaisons linéaires de quelques éléments d’un dictionnaire appris. Ceci peut être vu comme une extension du cadre classique des ondelettes, dont le but est de construire de tels dictionnaires (souvent des bases orthonormales) qui sont adaptés aux signaux naturels. Un succès important de cette approche a été sa capacité à modéliser des imagettes, et la performance des méthodes de débruitage d’images fondées sur elle. Nous traitons plusieurs questions ouvertes, qui sont reliées à ce cadre : Comment apprendre efficacement un dictionnaire ? Comment enrichir ce modèle en ajoutant une structure sous-jacente au dictionnaire ? Est-il possible d’améliorer les méthodes actuelles de traitement d’image fondées sur cette approche ? Comment doit-on apprendre le dictionnaire lorsque celui-ci est utilisé pour une tâche autre que la reconstruction de signaux ? Y a-t-il des applications intéressantes de cette méthode en vision par ordinateur ? Nous répondons à ces questions, avec un point de vue multidisciplinaire, en empruntant des outils d’apprentissage statistique, d’optimisation convexe et stochastique, de traitement des signaux et des images, de vison par ordinateur, mais aussi d'optimisation sur des graphes.

Keywords

Sparse coding Dictionary learning Image denoising Convex optimization Images features Sparsity

Représentation parcimonieuse Apprentissage statistique Traitement d'image

Domains

General Mathematics [math.GM]

Fichier principal

Mairal2010.pdf (35.93 Mo)

Origin : Version validated by the jury (STAR)

ABES STAR : Contact

https://theses.hal.science/tel-00595312

Submitted on : Tuesday, May 24, 2011-2:38:20 PM

Last modification on : Saturday, April 20, 2024-3:09:01 AM

Long-term archiving on: Thursday, August 25, 2011-2:24:28 AM

Dates and versions

tel-00595312 , version 1 (24-05-2011)

Identifiers

HAL Id : tel-00595312 , version 1

Cite

Julien Mairal. Sparse coding for machine learning, image processing and computer vision. General Mathematics [math.GM]. École normale supérieure de Cachan - ENS Cachan, 2010. English. ⟨NNT : 2010DENS0040⟩. ⟨tel-00595312⟩

Export

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

ENS-PARIS UNIV-RENNES1 CNRS INRIA IRISA STAR THESES-ENS UR1-THESES PSL UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES UR1-MATH-NUM

1630 View

3602 Download

Sparse coding for machine learning, image processing and computer vision

Représentations parcimonieuses en apprentissage statistique, traitement d’image et vision par ordinateur

Abstract

Keywords

Domains

Dates and versions

Identifiers

Cite

Export

Collections

Share