Canevas de domaines pour l'intégration de données - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2005

Data Domain Frameworks for Data Integration

Canevas de domaines pour l'intégration de données

Résumé

The focus of many research works on data integration has been on problems inherent to semantic and schema integration, query languages and query processing. In this thesis, one we focus on the problematic of the construction of such systems. We apply architectural concepts of distributed systems, namely those of framework and software components, in order to propose a data integration middleware offering four levels of adaptability. At the architectural level, we define a framework of data domains, the main software component unit for data integration. A data integration system is defined by the composition of data domains. At the data model level, we adopt a hybrid data model with a flexible type system that takes into account the structural heterogeneity of the data models of data sources. At the query language level, we propose a query expression framework that allows the description of queries for both views definition and data domain interrogation, independently of a particular syntax. At the optimization level, we propose an adaptable query optimization framework, in sense that it allows the construction and support of diverse search strategies. The query expression and optimization frameworks have been implemented as part of ObjectWeb consortium projects. These implementations have been used for developpingment two java object persistence standards, namely JDO (Java Data Object) and EJB-CMP (Container Managed Persistence). In the context of component retrieval for large scale administration needs, we propose to use our middleware for a query service system making it possible to retrieve components from both repository of component templates and running systems through associative introspection.
Beaucoup de travaux de recherche autour des systèmes d'intégration de données se sont concentrés sur les problémes liés aux schémas, aux langages et au traitement de requÍtes. Dans cette thèse, nous nous intéressons à la problématique de construction de tels systèmes. Nous appliquons les concepts architecturaux des systèmes répartis, notamment de canevas et de composant logiciel, pour proposer un intergiciel d'intégration de données offrant quatre niveaux d'adaptabilité. Au niveau architectural, nous définissons le canevas de domaine de données qui est le composant central de l'intégration. Un système d'intégration de données est défini par la composition de domaines de données. Au niveau modèle de données, nous adoptons un modèle hybride doté d'un typage flexible, associé au langage d'expression des vues de domaines, qui permet de prendre en compte l'hétérogénéité structurelle des sources (ou domaines) de données à intégrer. Au niveau langage de requêtes, nous proposons un canevas d'expression qui permet de décrire les requêtes à la fois pour l'intégration et pour l'interrogation de domaines, indépendamment d'une syntaxe particulière. Au niveau optimisation, nous proposons un canevas d'optimisation de requêtes adaptable, dans le sens ou il permet de construire et de supporter diverses stratÈgies de recherche. Le canevas d'expression et le canevas d'optimisation de requÍte ont été implantés dans le cadre du consortium ObjectWeb. Ces implantations ont été utilisÈes dans la mise en oeuvre de deux standards de persistance d'objets Java, à savoir JDO (Java Data Object) et EJB-CMP (Container Managed Persistance). Dans le contexte de recherche de composants pour des besoins d'administration des systèmes à large échelle, nous avons proposé une utilisation de notre intergiciel pour proposer un service de requête qui permette de rechercher des composants dans un gisement et dans des systèmes en cours d'exécution, par introspection associative.
Fichier principal
Vignette du fichier
tel-00010341.pdf (1.53 Mo) Télécharger le fichier

Dates et versions

tel-00010341 , version 1 (30-09-2005)

Identifiants

  • HAL Id : tel-00010341 , version 1

Citer

Mourad Alia. Canevas de domaines pour l'intégration de données. Réseaux et télécommunications [cs.NI]. Institut National Polytechnique de Grenoble - INPG, 2005. Français. ⟨NNT : ⟩. ⟨tel-00010341⟩

Collections

UGA IMAG CNRS
216 Consultations
89 Téléchargements

Partager

Gmail Facebook X LinkedIn More