Visualisation 3D adaptée par insertion synchronisée de données cachées - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2009

Visualisation 3D adaptée par insertion synchronisée de données cachées

Scalable 3D Visualization via Synchronous Data Hiding

Khizar Hayat
  • Fonction : Auteur
  • PersonId : 940846

Résumé

The principal objective of this thesis is to unify disparate 3D information and then realize scalable visualization in a client/server environment that is heterogeneous in terms of network, computing and memory resources. For scalability we are exploiting the multiresolution nature of the discrete wavelet transform (DWT) from the state of the art JPEG2000 codec. The data unification is being carried out through DWT domain blind data hiding that may either be fully or adaptively synchronous. A typical surface based 3D visualization requires at least two sets of data: a 2D intensity image, called texture, with a corresponding 3D shape rendered in the form of a range image, a shaded 3D model and/or a mesh of points. A range image, also sometimes called a depth image, is an image in which the pixel value reflects the distance from the sensor to the imaged surface. The texture is a corresponding 2D color image which is overlaid onto a model produced from the depth map by triangulation. For data hiding, the range data is first subjected to DWT while the texture data is input to the JPEG2000 encoder.
The JPEG2000 coding pipeline of texture is interrupted at some stage after the DWT step and the DWT domain range coefficients are embedded in the all or a subset of texture subbands. The embedded data is reintroduced to the JPEG2000 pipeline at the same step where the interruption was made. Since the JPEG2000 format is conserved during the process, the resultant code can be sent across any communication channel like any other JPEG2000 file. The resolution scalability of wavelets and the synchronized character of our techniques enable a 3D visualization even with fewer than original resolution bands as a result of partial or delayed data transfer. The method thus enables to effect a visualization from a fraction of data in the form of the lowest subband, of a particular resolution level. In the first phase of this work the thrust was on the perceptual transparency and that is
why least significant bit (LSB) embedding was employed for both the synchronous and adaptively synchronous cases. The second phase concerns robustness and that is a why spread spectrum (SS) strategy is utilized in embedding. During the latter phase the imperceptibility has not been ignored at all as the embedding is removable. Examples from the two main areas of terrain and face visualization have been taken as case studies to prove the utility of our methods. In the third and final phase we take a broader aspect of the problem when we try to render the underlying tile components of a heterogeneous tessellation, seamlessly. This seamless joining of tiles is ensured through special DWT domain smoothing functions.
L'objectif principal de ces travaux de thèse est d'unifier différentes informations 2D et 3D afin de réaliser une visualisation adaptée dans un environnement client/serveur hétérogène en termes de réseau, de traitement et de ressources mémoire. Dans ce contexte, nous avons exploité la nature multi-résolution de la transformée en ondelettes discrètes (TOD) du codeur JPEG2000. L'unification des données est réalisée par insertion aveugle, synchrone ou partiellement synchrone, des données cachées dans le domaine des ondelettes. Une visualisation 3D classique nécessite au moins deux types de données : une image 2D d'intensité, appelé texture, et une forme 3D pouvant être représentée par une image, un modèle 3D ombré ou un maillage de points. Ce type d'image, parfois également appelé carte de profondeur est une image dans laquelle la valeur des pixels reflète la distance du capteur à la surface par imagerie. La texture est une image 2D couleur qui est apposée sur le modèle 3D après triangulation. Au niveau de l'insertion des données cachées, la carte de profondeur est d'abord transformée dans le domaine des ondelettes tandis que la texture est insérée dans le codeur JPEG2000. Le processus de codage JPEG2000 de la texture est interrompue, et les coefficients 3D sont insérés dans la totalité ou dans un sous-ensemble des sous-bandes de la texture. Les données sont re-intégrées dans le codeur standard de JPEG2000 à l'endroit où l'interruption a été faite. Le fichier résultant peut alors être envoyé à travers tous types de canal de communication comme un autre fichier standard issu du codeur JPEG2000. Les différents niveaux de résolution et le caractère synchronisé de nos algorithmes permettent une visualisation en 3D, même avec peu de sous-bandes de résolution suite à un transfert partiel ou retardé. La méthode permet ainsi d'effectuer une visualisation à partir uniquement d'une fraction des données. Dans ce cas nous remplaçons par des zéros les coefficients des sous-bandes manquantes. La première phase de ce travail a concerné l'imperceptibilité; c'est la raison pour laquelle l'insertion a été réalisée dans les bits de poids plus faibles. La deuxième phase de ces travaux a concerné la robustesse, c'est pourquoi une stratégie d'insertion par étalement de spectres a été utilisée. Au cours de la seconde phase, l'imperceptibilité n'a pas été complètement ignorée, du fait que l'insertion des données est effaçable après l'extraction. Les deux applications principales sont la visualisation 3D de modèles numériques de terrains et de visages. Dans la troisième et dernière phase de ces travaux de thèse, nous avons élargi le problème en essayant de prendre en compte le problème d'assemblage de dalles de niveaux de résolutions différentes sans soudure apparente. Ceci a eté assuré par des fonctions de lissage dans le domaine des ondelettes.
Fichier principal
Vignette du fichier
thesis_4_2.pdf (3.56 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00400762 , version 1 (01-07-2009)
tel-00400762 , version 2 (04-07-2009)

Identifiants

  • HAL Id : tel-00400762 , version 2

Citer

Khizar Hayat. Visualisation 3D adaptée par insertion synchronisée de données cachées. Human-Computer Interaction [cs.HC]. Université Montpellier II - Sciences et Techniques du Languedoc, 2009. English. ⟨NNT : ⟩. ⟨tel-00400762v2⟩
383 Consultations
478 Téléchargements

Partager

Gmail Facebook X LinkedIn More