Représentations à base de parties pour la vision 3D de haut niveau

Résumé : Dans cette thèse, nous utilisons des modèles de parties déformables (Deformable Part Models – DPMs) pour apprendre à détecter des parties d’objets. Pour une image d’un objet, l’objectif est de déterminer l’emplacement des parties de cet objet dans l’image. Le problème d’optimisation qui en résulte est non-convexe et difficile en raison de son grand espace de recherche.Notre première contribution consiste à étendre les DPMs à la troisième dimension, grâce à un algorithme par séparation et évaluation (Branchand- Bound). Nous élaborons un algorithme personnalisé qui est deux fois plus rapide qu’une approche naïve et garantit l’optimalité globale. Nous dérivons pour le modèle 3-dimensionnel une structure 3-dimensionnel. Cependant, nous entrainons un algorithme prenant en compte chaque sous point de vue de l’apparence. Nous démontrons notre approche sur la tache de l’estimation 3-dimensionnel de la posture, en déterminant la posture de l’objet dans une fraction de second.Notre deuxième contribution nous permet d’effectuer une inférence efficace sur des modèles où les connexions des parties forment un graphe avec des boucles, étendant ainsi des modèles plus riches. Pour cela, nous utilisons l’algorithme des directions alternées (Alternating Direction Method of Multipliers – ADMM) pour découpler le problème et résoudre itérativement un ensemble de sous-problèmes plus faciles. Nous calculons les paramètres du modèle via un Réseaux Neuronal Convolutif pour la détermination de la posture 3-dimensionnel. L’inférence développée est utilisée comme dernière couche du réseau neural. Cela permet d’obtenir une performance à l’état de l’art pour la tâche d’estimation de pose humaine en 3D.
Type de document :
Thèse
Mathématiques générales [math.GM]. Université Paris-Saclay, 2018. Français. 〈NNT : 2018SACLC059〉
Liste complète des métadonnées

Littérature citée [106 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01885958
Contributeur : Abes Star <>
Soumis le : mardi 2 octobre 2018 - 14:33:16
Dernière modification le : jeudi 21 mars 2019 - 01:25:09
Document(s) archivé(s) le : jeudi 3 janvier 2019 - 15:00:20

Fichier

75422_KINAUER_2018_archivage.p...
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01885958, version 1

Citation

Stefan Kinauer. Représentations à base de parties pour la vision 3D de haut niveau. Mathématiques générales [math.GM]. Université Paris-Saclay, 2018. Français. 〈NNT : 2018SACLC059〉. 〈tel-01885958〉

Partager

Métriques

Consultations de la notice

148

Téléchargements de fichiers

115