Infrastructure adaptable pour les entrepots de données - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2002

Adaptable Infrastructure for Data Warehouse Evolution

Infrastructure adaptable pour les entrepots de données

Résumé

A data warehouse is a collection of historical data exploited by decision-support applications. It centralizes data of interest for a group of users so data acccess is fast, inexpensive and effective. In this work, we are interested in the evolution of data warehouses supporting multidimennsional data analysis applications. We propose an infrastructure to build warehouse managers that enable the creation and the evolution of data warehouses. A warehouse manager enables the creation of the schema of a data warcehouse and provides the means to modify this schema. It also offerd tools to build the warehouse from data coming from multiple heterogeneous and autonomous sources. It is basedd on a multidimensional data model that allows to manipulate the warehouse schema at an abstract level and to integrate heterogeneous data. We have specified a data model that is used for delining multidimensional schema. We propose a set of schema evolution primitives which guarantee that such a schema remains consistent between successive evolutions. We propose MDL, a language associated with our model, which offers expressions to create and evolve multidimensional schemata. To validate our approach, we implemented a prototype warehouse manager. It ensure the creation and the evolution of a relational data warehouse. This manager, developed in Java, integrates data in XML format coming from heterogeneous sources.
Un entrepôt de données est une collection de données historiqucs exploitées par les applications d'aide à la décision. Il centralise des données d'intérêts pour un groupe d'utilisateurs afin de rendre leur accès rapide, peu coûteux et efficace. Dans cette thèse, noue nous intéressons à l'évolution des entrepôts dédiée aux applications d'analyse inultidiinerisioriilelle. Voue proposons une infrastructure pour la construction de gestionnaires d'entrepôt autorisant la création et l'évolution d'entretrepôts de données. Un gestionnaire d'entrepôt autorise la création du shéma d'un entrepôt et fournit les moyens pour le faire évoluer. Il offre également des outils pour construire l'entrepôt à partir des données provenant de multiples sources hétérogènes et autonomes. Il se base sur un modèle de données multidimensionnelles, pivot permettant d'un côté la manipulation du schéma à un niveau abstrait, et d'un autre côté, la fusion de données hétérogènes. Nous avons spécifié un modèle de données utilisé pour la définition de schemas multidimensionnels. Nous proposons un ensemble de primitives d'évolution de schéma qui assurent la cohérence d'un tel schéma entre deux évolutions successives. Nous avons proposé MDL, un langage associé à notre modèle, qui offre des expressions pour créer et faire évoluer des schémas multidimensionnels. Pour valider notre approche, nous avons implanté un prototype de gestionnaire d'entrepôt. Il assure la création et l'évolution d'un entrepôt de données relationnelles. Ce gestionnaire, développé en Java, intègre des données au format XML provenant de sources hétérogènes.
Fichier principal
Vignette du fichier
tel-00010335.pdf (978.56 Ko) Télécharger le fichier

Dates et versions

tel-00010335 , version 1 (29-09-2005)

Identifiants

  • HAL Id : tel-00010335 , version 1

Citer

Edgard-Iván Benitez Guerrero. Infrastructure adaptable pour les entrepots de données. Interface homme-machine [cs.HC]. Université Joseph-Fourier - Grenoble I, 2002. Français. ⟨NNT : ⟩. ⟨tel-00010335⟩

Collections

UGA IMAG CNRS UJF
319 Consultations
814 Téléchargements

Partager

Gmail Facebook X LinkedIn More