Detecting and indexing moving objects for behavior analysis by video and audio interpretation

Alessia Saggese 1, 2
1 Equipe Image - Laboratoire GREYC - UMR6072
GREYC - Groupe de Recherche en Informatique, Image, Automatique et Instrumentation de Caen
Résumé : Dans les dernières décennies, nous avons été témoin d'un besoin grandissant de sécurité dans les espaces publics. Cette nécessite a conduit à une prolifération de caméras de surveillance et de microphones. Toutefois, la limitation principale induite par les systèmes de vidéo surveillance réside dans la surcharge cognitive des opérateurs humains chargés de la sécurité, ce qui diminue leur capacités à analyser le flux d'information émanant de sources multimédia multiples. Pour ces raisons, nous proposons dans cette thèse un système de surveillance intelligent capable d'associer des images et des vidéos à une interprétation sémantique afin de faire le lien entre des représentations bas niveau, sous forme de pixels, et le haut niveau correspondant à une description en langage naturel qu'un être humain pourrait faire d'une scène.Plus précisément, les travaux proposés dans cette thèse débutent par l'analyse des vidéos et par l'extraction des trajectoires des objets présents dans la scène (module de suivi) : Il est important de souligner que la trajectoire est une caractéristique primordiale étant donné que le mouvement des objets dans une scène n'est pas aléatoire, mais possède une structure sous-jacente qui peut aider à la conception de certaines modèles. Une fois extraites, ce grand nombre de trajectoires doit être indexé et stocké afin d'augmenter la performance du système durant la phase de reconnaissance (module de stockage et de reconnaissance). En outre, l'opérateur humain est informé immédiatement si un comportement anormal est observé (module de compréhension visuelle de comportement). Tandis que l'information extraite des vidéos n'est pas suffisante ou n'est pas suffisamment fiable, le système proposé est enrichi par un module en charge de la reconnaissance des événements sonores tels que des tirs, des cris ou des vitres cassées (module de reconnaissance audio). Il est important de noter que la fusion de l'information basée sur la vidéo et l'audio est une contribution importante et originale de nos travaux dans le cadre de l'analyse vidéo et audio.Chaque module proposé a été à la fois testé sur des jeux de données standards mais aussi dans un environnement réel ; les résultats obtenus, tout comme l'application des méthodes proposées dans un contexte réel, permettent de confirmer la contribution de nos travaux à l'état de l'art.
Type de document :
Thèse
Computer Science [cs]. Université de Caen, 2014. English
Liste complète des métadonnées

Littérature citée [136 références]  Voir  Masquer  Télécharger

https://hal.archives-ouvertes.fr/tel-01082696
Contributeur : Greyc Référent <>
Soumis le : vendredi 14 novembre 2014 - 10:18:28
Dernière modification le : mardi 5 février 2019 - 12:12:43
Document(s) archivé(s) le : vendredi 14 avril 2017 - 14:01:47

Identifiants

  • HAL Id : tel-01082696, version 1

Citation

Alessia Saggese. Detecting and indexing moving objects for behavior analysis by video and audio interpretation. Computer Science [cs]. Université de Caen, 2014. English. 〈tel-01082696〉

Partager

Métriques

Consultations de la notice

332

Téléchargements de fichiers

347