Part-Based Representations for High-Level 3D Vision

Résumé : Dans cette thèse, nous utilisons des modèles de parties déformables (Deformable Part Models – DPMs) pour apprendre à détecter des parties d’objets. Pour une image d’un objet, l’objectif est de déterminer l’emplacement des parties de cet objet dans l’image. Le problème d’optimisation qui en résulte est non-convexe et difficile en raison de son grand espace de recherche.Notre première contribution consiste à étendre les DPMs à la troisième dimension, grâce à un algorithme par séparation et évaluation (Branchand- Bound). Nous élaborons un algorithme personnalisé qui est deux fois plus rapide qu’une approche naïve et garantit l’optimalité globale. Nous dérivons pour le modèle 3-dimensionnel une structure 3-dimensionnel. Cependant, nous entrainons un algorithme prenant en compte chaque sous point de vue de l’apparence. Nous démontrons notre approche sur la tache de l’estimation 3-dimensionnel de la posture, en déterminant la posture de l’objet dans une fraction de second.Notre deuxième contribution nous permet d’effectuer une inférence efficace sur des modèles où les connexions des parties forment un graphe avec des boucles, étendant ainsi des modèles plus riches. Pour cela, nous utilisons l’algorithme des directions alternées (Alternating Direction Method of Multipliers – ADMM) pour découpler le problème et résoudre itérativement un ensemble de sous-problèmes plus faciles. Nous calculons les paramètres du modèle via un Réseaux Neuronal Convolutif pour la détermination de la posture 3-dimensionnel. L’inférence développée est utilisée comme dernière couche du réseau neural. Cela permet d’obtenir une performance à l’état de l’art pour la tâche d’estimation de pose humaine en 3D.
Type de document :
Thèse
General Mathematics [math.GM]. Université Paris-Saclay, 2018. English. 〈NNT : 2018SACLC059〉
Liste complète des métadonnées

Littérature citée [106 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01885958
Contributeur : Abes Star <>
Soumis le : mardi 2 octobre 2018 - 14:33:16
Dernière modification le : vendredi 5 octobre 2018 - 01:16:33

Fichier

75422_KINAUER_2018_archivage.p...
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01885958, version 1

Citation

Stefan Kinauer. Part-Based Representations for High-Level 3D Vision. General Mathematics [math.GM]. Université Paris-Saclay, 2018. English. 〈NNT : 2018SACLC059〉. 〈tel-01885958〉

Partager

Métriques

Consultations de la notice

96

Téléchargements de fichiers

20