Scattering Representations for Recognition

Résumé : Ma thèse étudie le problème de la reconnaissance des objets et des textures. Dans ce cadre, il est nécessaire de construire des représentations de signaux avec des propriétés d'invariance et de stabilité qui ne sont pas satisfaites par des approches linéaires. Les opérateurs de Scattering itèrent des décompositions en ondelettes et rectifications avec des modules complexes. Ces opérateurs définissent une transformée non-linéaire avec des propriétés remarquables ; en particulier, elle est localement invariante par translation et Lipschitz continue par rapport à l'action des difféomorphismes. De plus, les opérateurs de Scattering définissent une représentation des processus stationnaires qui capture les moments d'ordre supérieur, et qui peut être estimée avec faible variance à partir d'un petit nombre de réalisations. Dans cette thèse, nous obtenons des nouvelles propriétés mathématiques de la représentation en scattering, et nous montrons leur efficacité pour la reconnaissance des objets et textures. Grâce à sa continuité Lipschitz par rapport à l'action des difféomorphismes, la transformée en scattering est capable de linéariser les petites déformations. Cette propriété peut être exploitée en pratique avec un classificateur génératif affine, qui nous permet d'obtenir l'état de l'art sur la reconnaissance des chiffres manuscrites. Nous étudions ensuite les représentations en Scattering des textures dans le cadre des images et du son. Nous montrons leur capacité à discriminer des phénomènes non-gaussiens avec des estimateurs à faible variance, ce qui nous permet d'obtenir de l'état de l'art pour la reconnaissance des textures. Finalement, nous nous intéressons aux propriétés du Scattering pour l'analyse multifractale. Nous introduisons une renormalisation des coéfficients en Scattering qui permet d'identifier de façon efficace plusieurs paramètres multifractales; en particulier, nous obtenons une nouvelle caractérisation de l'intermittence à partir des coefficients de Scattering ré-normalisés, qui peuvent s'estimer de façon consistante.
Type de document :
Thèse
Computer Vision and Pattern Recognition [cs.CV]. Ecole Polytechnique X, 2013. English
Liste complète des métadonnées

Littérature citée [97 références]  Voir  Masquer  Télécharger

https://pastel.archives-ouvertes.fr/pastel-00905109
Contributeur : Joan Bruna <>
Soumis le : samedi 16 novembre 2013 - 07:03:40
Dernière modification le : jeudi 9 février 2017 - 15:13:17
Document(s) archivé(s) le : lundi 17 février 2014 - 02:45:23

Identifiants

  • HAL Id : pastel-00905109, version 1

Collections

Citation

Joan Bruna. Scattering Representations for Recognition. Computer Vision and Pattern Recognition [cs.CV]. Ecole Polytechnique X, 2013. English. 〈pastel-00905109〉

Partager

Métriques

Consultations de
la notice

299

Téléchargements du document

371