Analyse visuelle sémantique de scènes - TEL - Thèses en ligne Accéder directement au contenu
Hdr Année : 2021

Analyse visuelle sémantique de scènes

Résumé

In a world where images have become a preeminent vector of information, visual recognition and scene understanding technologies have developed at a sustained pace over the last few years in order to help us exploit ever larger quantities of data more efficiently. Driven by the remarkable progress of machine learning, the availability of annotated image data sets and reusable software, and new computing hardware platforms, computer vision has experienced exceptional growth in recent years, allowing industrial players to meet many application needs in many areas: mobility, security, defense, health, industry of the future... Automatic scene understanding is a complex task whose objective is to produce from images and videos, and at different semantic levels, an accurate description of the elements of a scene, a characterization of their evolution in time, and an analysis of their behavior. This vast problem covers many research topics, each of them dealing with a particular aspect of scene analysis, whose main challenges are robustness in the face of the immense variety of situations, accuracy, finesse and relevance of the analysis, and computational complexity. In our work, we have sought to provide answers to the problems of semantic scene analysis by exploring, on the one hand, new methods for modeling objects and people in images, ranging from fast and robust detection, to person re-identification and characterization of 3D human poses from 2D images, and on the other hand, by proposing direct approaches to behavior analysis and event detection from video streams, that are not relying on an explicit individualization of people.
Dans un monde où l'image est devenue sans conteste un vecteur prééminent d'information, les technologies de reconnaissance visuelle et de compréhension de scène se sont développées ces dernières années à un rythme soutenu dans le but de nous aider à exploiter plus efficacement des quantités toujours plus importantes de données. Portée par les progrès remarquables de l'apprentissage automatique, la disponibilité de corpus d'images annotées et d'outils logiciels, les nouvelles plateformes matérielles de calcul, la vision par ordinateur a connu ces dernières années un essor exceptionnel, permettant aujourd'hui aux acteurs industriels de répondre à de nombreux besoins applicatifs dans beaucoup de domaines: mobilité, sécurité, défense, santé, industrie du futur... La compréhension automatique des scènes est une tâche complexe dont l'objectif est de produire à partir d'images et de vidéos, à différents niveaux sémantiques, une description précise des éléments d'une scène, une caractérisation de leur évolution dans le temps, et une analyse de leur comportement. Cette vaste problématique recouvre de nombreuses sujets de recherche, chacun d'eux traitant d'un aspect particulier de l'analyse de scène, dont les principaux défis sont la robustesse face à l'immense variété des situations, la précision, la finesse et la pertinence de l'analyse, et la complexité calculatoire. Dans nos travaux, nous avons cherché à apporter des éléments de réponse aux problèmes de l'analyse sémantique de scènes en explorant, d'une part, de nouvelles méthodes de modélisation des objets et des personnes dans les images, allant de la détection rapide et robuste, à la ré-identification et à la caractérisation des poses 3D à partir d'images 2D, et d'autre part, en proposant des approches directes d'analyse de comportement et de détection d'événements dans les flux vidéos, ne reposant pas sur une individualisation explicite des personnes.
Fichier principal
Vignette du fichier
MemoireHDR-QCPHAM.pdf (51.04 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)

Dates et versions

tel-04322440 , version 1 (04-12-2023)

Identifiants

  • HAL Id : tel-04322440 , version 1

Citer

Quoc-Cuong Pham. Analyse visuelle sémantique de scènes : De la modélisation des objets à l’analyse de comportement. Informatique [cs]. Sorbonne Universite, 2021. ⟨tel-04322440⟩
36 Consultations
1 Téléchargements

Partager

Gmail Facebook X LinkedIn More