login
english version rss feed
Detailed view PhD thesis
Université Joseph-Fourier - Grenoble I (07/09/2006), Jeanny HÉRAULT (Dir.)
Attached file list to this document: 
PDF
massot.pdf(12.1 MB)
Texture et Perception 3D dans les Scènes Naturelles : Modèles d'Inspiration Biologique et Expérimentations Psychophysiques.
Corentin Massot1

Dans ce travail nous nous intéressons à l'analyse et l'extraction de l'information 3D (orientation et forme) contenue dans les images de scènes naturelles et des textures homogènes. Pour cela nous adoptons une approche pluridisciplinaire de la modélisation du système visuel.

Nous présentons d'abord des expérimentations psychophysiques où nous avons cherché à évaluer la contribution relative des indices de variation de fréquence et de perspective linéaire pour la perception 3D.
Pour cela nous avons créé des stimuli spécifiques représentant des textures homogènes composées de masques de Gabor disposés sur une surface plane.
Le plan est vu en projection perspective suivant une inclinaison (slant) et une orientation (tilt) particulière.
La fréquence et l'orientation de chaque masque de Gabor sont déterminées en fonction du gradient de fréquence local et de la perspective linéaire locale définis par la projection.
Nous synthétisons ainsi des textures présentant uniquement une variation de fréquence ou une variation d'orientation ou les deux types de variation (en combinaison ou en conflit).

Pour chaque texture, une tâche de discrimination du slant et du tilt est effectuée. L'indice de variation de fréquence apparaît prépondérant dans l'estimation de l'inclinaison d'une surface par rapport à la perspective linéaire.
Par contre les deux indices jouent un role dans l'estimation de l'orientation.
Ces résultats valident l'utilisation de nos stimuli pour la perception 3D et permettent de préciser la décomposition de l'indice de texture en composantes élémentaires.

Basé sur cette approche, nous présentons un modèle biologiquement plausible d'analyse de la variation de fréquence au niveau de V1.
Nous modélisons la réponse des cellules complexes par des filtres log-normaux à variables séparables présentant différents avantages théoriques et pratiques par rapport aux filtres de Gabor classiquement utilisés.i
L'algorithme se compose d'une étape de prétraitement composé d'un filtrage rétinien pour ne conserver que les informations de texture et d'une décomposition de l'image en un ensemble d'imagettes similairement aux champs récepteurs des cellules corticales.
Une technique robuste d'estimation de la fréquence moyenne locale, indépendante de l'information d'orientation et correspondant à une combinaison simple de lensemble des filtres est appliquée à chaque imagette.
La mesure de la variation locale de fréquence entre chaque imagette permet d'estimer le tilt et le slant de la surface étudiée ainsi que sa forme.

La méthode est évaluée sur différentes bases d'images et de textures. Elle s'avère comparable en précision aux autres techniques et s'applique à des textures irrégulières avec une moindre complexité calculatoire.
1:  LIS - Laboratoire des images et des signaux
perception 3D – scènes naturelles – texture – fréquence – perspective linéaire

Texture and 3D Perception in Natural Scenes : Biologically Inspired Models and Psychophysical Experiments.
In this work we are interested in the analysis and the extraction of the 3D information (orientation and shape) contained in natural scenes and homogeneous textures.
For this, we adopt a multidisciplinary approach of the modeling of the visual system.

We first present psychophysical experiments aiming at evaluating the relative contribution of the frequency variation and of the linear perspective cues involved in 3D perception.
To do so we have created purposely designed stimuli representing homogeneous textures made of Gabor patches displayed on a planar surface.
The plane is viewed under perspective projection with particular slant and tilt angles.
The frequency and the orientation of each Gabor patch are set according to the local frequency gradient and the local linear perspective defined by the projection.
We synthesise textures presenting a frequency variation alone or an orientation variation alone or both kind of variations (in combination or in conflict).

For each texture, a tilt and a slant discrimination task are performed.
The frequency variation cue appeared to dominate over the linear perspective cue for slant estimation.
However both cues are involved in the tilt estimation.
These results validate the use of our stimuli for 3D perception study and the decomposition of the texture cue into elementary components.

Based on this approach, we present a biologically plausible model of the frequency variation analysis in the cortical area V1.
We model the complex cells responses with log-normal filters which present different theoretical and practical advantages against the classical Gabor filters.
The algorithm is composed of a pre-treatment stage corresponding to a retinal filtering allowing to keep only the texture information and of a decomposition of the image into local patches similarly to the cortical cells receptive fields.
A robust technique aiming at estimating the local mean frequency, independently of the orientation information, and corresponding to a simple combination of the whole set of filters is applied to every patch.
The measure of the local frequency variation between each patch allows to estimate the tilt and slant angles of the studied surface and its shape.

The method is evaluated on different images and textures databases.
It appears to be comparable in precision with the best known techniques and can be applied to irregular textures with a lower computational cost.
3D perception – natural scenes – texture – frequency – linear perspective

all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...
all articles on CCSd database...