Synthetic 3D Model-Based Object Class Detection and Pose Estimation

Joerg Liebelt 1
1 LEAR - Learning and recognition in vision
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, INPG - Institut National Polytechnique de Grenoble
Résumé : Cette thèse porte sur la détection de classes d'objets et l'estimation de leur poses à partir d'une seule image en utilisant des étapes d'apprentissage, de détection et d'estimation adaptées aux données synthétiques. Nous proposons de créer des représentations en 3D de classes d'objets permettant de gérer simultanément des points de vue différents et la variabilité intra-classe. Deux méthodes différentes sont proposées : La première utilise des données d'entraînement purement synthétiques alors que la seconde approche est basée sur un modèle de parties combinant des images d'entraînement réelles avec des données géométriques synthétiques. Pour l'entraînement de la méthode purement synthétique, nous proposons une procédure non-supervisée de filtrage de descripteurs locaux afin de rendre les descripteurs discriminatifs pour leur pose et leur classe d'objet. Dans le cadre du modèle de parties, l'apparence d'une classe d'objets est apprise de manière discriminative à partir d'une base de données annotée et la géométrie en 3D est apprise de manière générative à partir d'une base de modèles CAO. Pendant la détection, nous introduisons d'abord une méthode de vote en 3D qui renforce la cohérence géométrique en se servant d'une estimation robuste de la pose. Ensuite, nous décrivons une deuxième méthode d'estimation de pose qui permet d'évaluer la probabilité de constellations de parties détectées en 2D en utilisant une géométrie 3D entière. Les estimations approximatives sont ensuite améliorées en se servant d'un alignement de modèles 3D CAO avec des images en 2D ce qui permet de résoudre des ambiguïtés et de gérer des occultations.
Type de document :
Thèse
Human-Computer Interaction [cs.HC]. Institut National Polytechnique de Grenoble - INPG, 2010. English
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00553343
Contributeur : Joerg Liebelt <>
Soumis le : vendredi 7 janvier 2011 - 11:13:00
Dernière modification le : vendredi 7 janvier 2011 - 14:33:04
Document(s) archivé(s) le : vendredi 8 avril 2011 - 02:58:40

Fichier

Identifiants

  • HAL Id : tel-00553343, version 1

Collections

Citation

Joerg Liebelt. Synthetic 3D Model-Based Object Class Detection and Pose Estimation. Human-Computer Interaction [cs.HC]. Institut National Polytechnique de Grenoble - INPG, 2010. English. <tel-00553343>

Partager

Métriques

Consultations de
la notice

577

Téléchargements du document

1061