Probabilistic XML: A Data Model for the Web - TEL - Thèses en ligne Access content directly
Habilitation À Diriger Des Recherches Year : 2012

Probabilistic XML: A Data Model for the Web

XML probabiliste: Un modèle de données pour le Web

Pierre Senellart

Abstract

Data extracted from the Web often come with uncertainty: they may contain contradictions or result from inherently uncertain processes such as data integration or automatic information extraction. In this habilitation thesis, I present probabilistic XML data models, how they can be used to represent Web data, and the complexity of the different data management operations on these models. I give an exhaustive survey of the state-of-the-art in this field, insisting on my own contributions. I conclude with a summary of my research plans.
Les données extraites du Web sont chargées d'incertitude: elles peuvent contenir des contradictions ou résulter de processus par nature incertains comme l'intégration de données ou l'extraction automatique d'informations. Dans cette thèse d'habilitation, je présente les modèles de données XML probabilistes, la manière dont ils peuvent être utilisés pour représenter les données du Web, et la complexité de différentes opérations de gestion de données sur ces modèles. Je donne un état de l'art exhaustif du domaine, en insistant sur mes propres contributions. Je termine par un résumé de mes futurs projets de recherche.
Fichier principal
Vignette du fichier
senellart2012probabilistic.pdf (1.18 Mo) Télécharger le fichier
hdr-20120613.pdf (4.55 Mo) Télécharger le fichier
Format : Other
Loading...

Dates and versions

tel-00758055 , version 1 (28-11-2012)

Identifiers

  • HAL Id : tel-00758055 , version 1

Cite

Pierre Senellart. Probabilistic XML: A Data Model for the Web. Databases [cs.DB]. Université Pierre et Marie Curie - Paris VI, 2012. ⟨tel-00758055⟩
233 View
546 Download

Share

Gmail Facebook X LinkedIn More