Representing 3D models for alignment and recognition

Mathieu Aubry 1, 2, 3
3 WILLOW - Models of visual object recognition and scene understanding
DI-ENS - Département d'informatique de l'École normale supérieure, ENS Paris - École normale supérieure - Paris, Inria Paris-Rocquencourt, CNRS - Centre National de la Recherche Scientifique : UMR8548
Résumé : Cette thèse explore différentes représentations de modèles 3D pour la mise en correspondance de formes 3D, l’alignement d’une instance 2D et de son modèle 3D et l’alignement de modèles 3D à une image 2D pour toute une catégorie d’objets. La géométrie d’une forme 3D est presque entièrement encodée par les fonctions et valeurs propres de l’opérateur de Laplace-Beltrami sur cette forme. Nous utilisons cette représentation mathématiquement élégante pour caractériser les points d’une forme en développant une nouvelle notion d’échelle. Nous montrons que cette signature présente plusieurs avantages. Un élément clé de la compréhension d’une image est l’alignement des objets qu’elle contient à leur modèle 3D. Nous considérons ce problème d’alignement 2D-3D pour une représentation 2D arbitraire, telle un dessin ou une peinture. Nous représentons le modèle d’un site architectural par un ensemble d’elements visuels discriminants. Nous développons ensuite une procédure pour mettre ces éléments en correspondance avec une représentation 2D du site. Nous validons notre méthode sur une nouvelle base de données de représentations historiques et non-photographiques. Nous étendons cette approche pour décrire non pas un unique site architectural, mais une catégorie entière d’objets, représentée par une grande collection de modèles 3D. Notre méthode d’alignement 2D-3D pour une catégorie d’objets non seulement détecte les instances, mais identifie une approximation de leur style et de leur point de vue. Nous évaluons notre approche sur un sous-ensemble de la difficile base de donnée “Pascal VOC 2007” pour la catégorie des chaises, que nous représentons pas une base de donnée de 1394 modèles 3D.
Type de document :
Thèse
Computer Vision and Pattern Recognition [cs.CV]. ENS, 2015. English
Liste complète des métadonnées

Littérature citée [192 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01160300
Contributeur : Mathieu Aubry <>
Soumis le : mardi 9 juin 2015 - 19:50:16
Dernière modification le : jeudi 29 septembre 2016 - 01:22:40
Document(s) archivé(s) le : mardi 25 avril 2017 - 03:15:21

Identifiants

  • HAL Id : tel-01160300, version 1

Collections

Citation

Mathieu Aubry. Representing 3D models for alignment and recognition. Computer Vision and Pattern Recognition [cs.CV]. ENS, 2015. English. 〈tel-01160300〉

Partager

Métriques

Consultations de la notice

837

Téléchargements de fichiers

1119