Extraction multimodale de métadonnées de séquences video dans un cadre bayésien

Siwar Baghdadi

Theses Year : 2010

Multimodal extraction of metadata from video streams in a Bayesian framework

Extraction multimodale de métadonnées de séquences video dans un cadre bayésien

(1, 2)

1
2

Siwar Baghdadi

Function : Author

Technicolor R & I [Cesson Sévigné]

Multimedia content-based indexing

Abstract

The description of multimedia contents

Le domaine de la description de contenus multimédias est un domaine relativement récent qui a pris une grand importance dans la monde industriel et celui de la recherche, vu l'augmentation considérable de la production de contenus. Un besoin grandissant de systèmes capables de fournir une description sémantique est plus que jamais à l'ordre du jour. Dans ce domaine, les réseaux bayésiens ont été largement utilisés pour modéliser les données vidéos, afin d'en extraire des métadonnées sémantiques. Toutefois, les systèmes basés sur les réseaux bayésiens nécessitent qu'on fixe préalablement leur structure. Cette opération se fait, généralement, soit en utilisant des connaissances a priori, ce qui résulte en un système peu généralisable, soit en utilisant l'hypothèse d'indépendance des flux de données, ce qui résulte en un système peu optimal. Motivés par la nécessité de fournir des systèmes génériques capables de s'adapter à la grande diversité des applications envisageables, nous utilisons l'apprentissage de structure pour construire automatique le réseau bayésien. En apprenant la structure automatiquement à partir d'une base de données, nous n'avons plus besoin de connaissances externes ou de faire des suppositions, souvent peu réalistes, pour la mise en place de la structure du réseau bayésien utilisé. Différentes techniques d'apprentissage de structure ont été utilisés. Nous concluons à la nécessité d'adapter l'apprentissage de structure dans les réseau bayésiens statiques et dynamiques à la classification. En associant Apprentissage de structure et sélection d'attributs, nous obtenons un cadre permettant de construire automatiquement des systèmes de descriptions de contenus sans être dépendants de connaissances externes.

Keywords

Bayesian networks structure learning video structuring

réseaux bayésiens apprentissage de structure structuration de vidéo

Domains

Human-Computer Interaction [cs.HC]

Fichier principal

vf_these.pdf (1.98 Mo)

Patrick Gros : Connect in order to contact the contributor

https://theses.hal.science/tel-00512706

Submitted on : Tuesday, August 31, 2010-12:36:05 PM

Last modification on : Friday, March 24, 2023-2:52:53 PM

Long-term archiving on: Wednesday, December 1, 2010-2:44:55 AM

Dates and versions

tel-00512706 , version 1 (31-08-2010)

Identifiers

HAL Id : tel-00512706 , version 1

Cite

Siwar Baghdadi. Extraction multimodale de métadonnées de séquences video dans un cadre bayésien. Interface homme-machine [cs.HC]. Université Rennes 1, 2010. Français. ⟨NNT : ⟩. ⟨tel-00512706⟩

Export

BibTeX XML-TEI Dublin Core DC Terms EndNote DataCite

Collections

EC-PARIS UNIV-RENNES1 CNRS INRIA INSA-RENNES IRISA IRISA-D6 INRIA2 UR1-THESES UR1-MATH-STIC UR1-UFR-ISTIC UNIV-RENNES INSA-GROUPE UR1-MATH-NUM

234 View

321 Download

Multimodal extraction of metadata from video streams in a Bayesian framework

Extraction multimodale de métadonnées de séquences video dans un cadre bayésien

Abstract

Keywords

Domains

Dates and versions

Identifiers

Cite

Export

Collections

Share