Fast and accurate human action recognition using RGB-D cameras

Résumé : ARécemment, les caméras RGB-D ont été introduites sur le marché et ont permis l’exploration de nouvelles approches de reconnaissance d’actions par l’utilisation de deux modalités autres que les images RGB, à savoir, les images de profondeur et les séquences de squelette. Généralement, ces approches ont été évaluées en termes de taux de reconnaissance. Cette thèse s’intéresse principalement à la reconnaissance rapide d’actions à partir de caméras RGB-D. Le travail a été focalisé sur une amélioration conjointe de la rapidité de calcul et du taux de reconnaissance en vue d’une application temps-réel. Dans un premier temps, nous menons une étude comparative des méthodes existantes de reconnaissance d’actions basées sur des caméras RGB-D en utilisant les deux critères énoncés : le taux de reconnaissance et la rapidité de calcul. Suite aux conclusions résultant de cette étude, nous introduisons un nouveau descripteur de mouvement, à la fois précis et rapide, qui se base sur l’interpolation par splines cubiques de valeurs cinématiques du squelette, appelé Kinematic Spline Curves (KSC). De plus, afin de pallier les effets négatifs engendrés par la variabilité anthropométrique, la variation d’orientation et la variation de vitesse, des méthodes de normalisation spatiale et temporelle rapide ont été proposées. Les expérimentations menées sur quatre bases de données prouvent la précision et la rapidité de ce descripteur. Dans un second temps, un deuxième descripteur appelé Hiearchical Kinematic Coavarince(HKC) est introduit. Ce dernier est proposé dans l’optique de résoudre la question de reconnaissance rapide en ligne. Comme ce descripteur n’appartient pas à un espace euclidien, mais à l’espace des matrices Symétriques semi-Définies Positives (SsDP), nous adaptons les méthodes de classification à noyau par l’introduction d’une distance inspirée de la distance Log-Euclidienne, que nous appelons distance Log-Euclidienne modifiée. Cette extension nous permet d’utiliser des classifieurs adaptés à l’espace de caractéristiques (SPsD).Une étude expérimentale montre l’efficacité de cette méthode non seulement en termes de rapidité de calcul et de précision, mais également en termes de latence observationnelle. Ces conclusions prouvent que cette approche jointe à une méthode de segmentation d’actions pourrait s’avérer adaptée à la reconnaissance en ligne et ouvrent ainsi de nouvelles perspectives pour nos travaux futurs.
Type de document :
Thèse
Human-Computer Interaction [cs.HC]. Normandie Université, 2017. English. 〈NNT : 2017NORMR027〉
Liste complète des métadonnées

Littérature citée [197 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01662496
Contributeur : Abes Star <>
Soumis le : mercredi 13 décembre 2017 - 11:07:30
Dernière modification le : samedi 28 avril 2018 - 03:17:34

Fichier

ghorbelenjie2.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01662496, version 1

Collections

Citation

Enjie Ghorbel. Fast and accurate human action recognition using RGB-D cameras. Human-Computer Interaction [cs.HC]. Normandie Université, 2017. English. 〈NNT : 2017NORMR027〉. 〈tel-01662496〉

Partager

Métriques

Consultations de la notice

307

Téléchargements de fichiers

97