Comment déchiffrer le code impulsionnel de la Vision? Étude du flux parallèle, asynchrone et épars dans le traitement visuel ultra-rapide. - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2003

Comment déchiffrer le code impulsionnel de la Vision? Étude du flux parallèle, asynchrone et épars dans le traitement visuel ultra-rapide.

Résumé

How to decipher vision's spiking code? Study of the parallel, asynchronous and sparse flow in the ultra-rapid visual processing. We build and study dynamical models of visual coding as a parallel and asynchronous flow of information coded thanks to their succession in time. We will at first base the mechanisms of this code on the biological processes on the scale of the neurone and synapse. In particular, synaptic plasticity may induce the non-supervised extraction of coherent information in the flow of the neuronal impulses. Coding by the latency of the first spike can defines a code in the optic nerve based on multi-scale architecture. We extended these results by using an ecological approach allowing thanks to the \emph(statistics of natural images) the quantization of analog value by the spikes' rank. This visual code is based on a hierarchical feed-forward architecture which is distinguished, in addition to its simplicity, by its mathematical and computational performances. We will meet the needs for an effective model of Vision by defining a theory of \emph(over-complete event representation) of the image. This formalization leads then to a strategy of a \emph(sparse spike code) by defining lateral interactions. Thanks to a reinforcement learning rule, this strategy can then be extended to a model of an \emph(adaptive cortical column) which shows emergence of representation dictionaries. Moreover, this paradigm adapts particularly to the construction of a saliency map. These techniques allow emergence of new tools for image processing and active vision which are particularly adapted to distributed computing architectures.
Le cadre de ce travail est l'étude de modèles neuromimétiques de codage parallèle et asynchrone de l'information visuelle ---tel qu'il est mis en évidence dans des taches de traitement ultra-rapide--- en la transformant en une vague d'événements élémentaires d'importance décroissante. Nous allons baser dans un premier temps les mécanismes de ce code sur les processus biologiques à l'échelle du neurone et de la synapse. En particulier, la plasticité synaptique peut induire l'extraction non-supervisée de l'information cohérente dans le flux des impulsions neuronales. Le codage par la latence de la première décharge permet de définir un code impulsionnel dans le nerf optique grâce une architecture multiéchelle. Nous avons étendu cette démarche en utilisant une approche \emph(écologique) qui permet exploiter les régularités de ses coefficients sur les images naturelles pour les quantifier par le rang d'arrivée des impulsions neuronales. Ce code par le rang des décharges, est basé sur une architecture hiérarchique et ``en avant'' qui se distingue, outre sa simplicité, par la richesse des résultats mathématiques et de par ses performances computationnelles. Enfin, nous avons répondu aux besoins d'un modèle efficace de la Vision en fondant une théorie de \emph(représentation impulsionnelle sur-complète) de l'image. Cette formalisation conduit alors à une stratégie de \emph(code impulsionnel épars) en définissant des interactions latérales. Cette stratégie est étendue à un modèle général de \emph(colonne corticale adaptative) permettant l'émergence de dictionnaires de représentation et s'adapte particulièrement à la construction d'une carte de saillance. Ces techniques font émerger de nouveaux outils pour le traitement de l'image et de vision active adaptés à des architectures de calcul distribué.
Fichier principal
Vignette du fichier
tel-000026931.pdf (3.62 Mo) Télécharger le fichier
emergence.avi (7.52 Mo) Télécharger le fichier
lena.avi (430.31 Ko) Télécharger le fichier
lena_V1.avi (194.5 Ko) Télécharger le fichier
tel-00002693.pdf (6.99 Mo) Télécharger le fichier
v1tigre.avi (6.09 Mo) Télécharger le fichier
Format Autre
Format Autre
Format Autre
Format Autre
Format Autre
Loading...

Dates et versions

tel-00002693 , version 1 (07-04-2003)

Identifiants

  • HAL Id : tel-00002693 , version 1

Citer

Laurent Perrinet. Comment déchiffrer le code impulsionnel de la Vision? Étude du flux parallèle, asynchrone et épars dans le traitement visuel ultra-rapide.. domain_other. Université Paul Sabatier - Toulouse III, 2003. Français. ⟨NNT : ⟩. ⟨tel-00002693⟩

Collections

ONERA
181 Consultations
676 Téléchargements

Partager

Gmail Mastodon Facebook X LinkedIn More