Segmentation supervisée d'actions à partir de primitives haut niveau dans des flux vidéos - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2014

Action supervised segmentation based on high level features on video streams

Segmentation supervisée d'actions à partir de primitives haut niveau dans des flux vidéos

Résumé

This thesis focuses on the supervised segmentation of video streams within the application context of daily action recognition.A segmentation algorithm is obtained from Implicit Shape Model by optimising the votes existing in this polling method.We prove that this optimisation can be linked to the sliding windows plus SVM framework and more precisely is equivalent with a standard training by adding temporal constraint, or, by encoding the data through a dense pyramidal decomposition. This algorithm is evaluated on a public database of segmentation where it outperforms other Implicit Shape Model like methods and the standard linear SVM.This algorithm is then integrated into a action segmentation system.Specific features are extracted from skeleton obtained from the video by standard software.These features are then clustered and given to the polling method.This system, combining our feature and our algorithm, obtains the best published performance on a human daily action segmentation dataset.
Cette thèse porte sur la segmentation supervisée de flux vidéo dans un contexte applicatif lié à la reconnaissance d'actions de la vie courante.La méthode de segmentation proposée est dérivée la méthode des modèles de formes implicites (Implicit Shape Model) et s'obtient en optimisant les votes présents dans cette méthode d'élection.Nous démontrons que cette optimisation (dans un contexte de fenêtre temporelle glissante) peut être exprimée de manière équivalente dans le formalisme des SVM en imposant une contrainte de cohérence temporelle à l'apprentissage, ou, en représentant la fenêtre glissante selon une décomposition pyramidale dense.Tout ce processus est validé expérimentalement sur un jeu de données de la littérature de segmentation supervisée.Il y surpasse les autres méthodes de type modèles de formes implicites et le SVM linéaire standard.La méthode proposée est ensuite mise en œuvre dans le cadre de la segmentation supervisée d'actions.Pour cela, des primitives dédiées sont extraites des données squelette de la personne d'intérêt obtenues grâce à des logiciels standards.Ces primitives sont ensuite quantifiées puis utilisées par la méthode d'élection.Ce système de segmentation d'actions obtient les meilleurs scores de l'état de l'art sur un jeu de données de la littérature de reconnaissance d'actions, ce qui valide cette combinaison des primitives et de la méthode d'élection.
Fichier principal
Vignette du fichier
these_archivage_3159865o.pdf (2.14 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)

Dates et versions

tel-01084604 , version 1 (19-11-2014)

Identifiants

  • HAL Id : tel-01084604 , version 1

Citer

Adrien Chan-Hon-Tong. Segmentation supervisée d'actions à partir de primitives haut niveau dans des flux vidéos. Traitement du signal et de l'image [eess.SP]. Université Pierre et Marie Curie - Paris VI, 2014. Français. ⟨NNT : 2014PA066226⟩. ⟨tel-01084604⟩
292 Consultations
213 Téléchargements

Partager

Gmail Facebook X LinkedIn More