Skip to Main content Skip to Navigation
Theses

Robust and efficient models for action recognition and localization

Dan Oneata 1
1 LEAR - Learning and recognition in vision
Inria Grenoble - Rhône-Alpes, LJK - Laboratoire Jean Kuntzmann, Grenoble INP - Institut polytechnique de Grenoble - Grenoble Institute of Technology
Résumé : Vidéo d'interprétation et de compréhension est l'un des objectifs de recherche à long terme dans la vision par ordinateur. Vidéos réalistes tels que les films présentent une variété de problèmes difficiles d'apprentissage machine, telles que la classification d'action / récupération d'action, de suivi humaines, la classification interaction homme / objet, etc Récemment robustes descripteurs visuels pour la classification vidéo ont été développés, et ont montré qu'il est possible d'apprendre classificateurs visuels réalistes des paramètres difficile. Toutefois, afin de déployer des systèmes de reconnaissance visuelle à grande échelle dans la pratique, il devient important d'aborder l'évolutivité des techniques. L'objectif principal est cette thèse est de développer des méthodes évolutives pour l'analyse de contenu vidéo (par exemple pour le classement ou la classification).
Complete list of metadatas

Cited literature [263 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-01217362
Contributor : Abes Star :  Contact
Submitted on : Monday, October 19, 2015 - 2:52:16 PM
Last modification on : Friday, July 3, 2020 - 4:49:06 PM
Document(s) archivé(s) le : Wednesday, January 20, 2016 - 1:00:49 PM

File

ONEATA_2015_archivage.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01217362, version 1

Collections

Citation

Dan Oneata. Robust and efficient models for action recognition and localization. Computer Vision and Pattern Recognition [cs.CV]. Grenoble Alpes, 2015. English. ⟨NNT : 2015GREAM019⟩. ⟨tel-01217362⟩

Share

Metrics

Record views

4825

Files downloads

1924