Optimisation Extensible dans un Mediateur de Données Semi-Structurées - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2006

Extensible Optimization in an XML Mediator

Optimisation Extensible dans un Mediateur de Données Semi-Structurées

Résumé

This thesis proposes to evaluate XQuery queries into a mediation context.
This mediator must federate several heterogeneous data sources with an appropriate query
model. On this model, an optimization framework must be defined to increase performance.
The well-known Tree Pattern model can represent a subset of XPath queries in a tree form.
Because of the complexity of XQuery, no model has been proposed that is able to represent all
the structural components of the language. Then, we propose a new logical model for XQuery
queries called TGV. It aims at supporting the whole XQuery specification for un-typed que-
ries. Before modelling, a canonization step transforms XQuery queries into a canonical form
in order to check more XQuery specifications. This form allows us to translate in a unique
way queries into our TGV model. This model takes into account a distributed heteroge-
neous context and eases the optimization process. It integrates transformation rules, cost
evaluation, and therefore, execution of XQuery queries. The TGV can be used as a basis
for processing XQuery queries, since it is °exible, it provides abstracts data types which can
be implemented according to the underneath data model. Moreover, it allows user-defined
annotating and also cost-related annotating for cost estimation. Although the model will be
useful, it relies on XQuery complicated specifications. TGV are illustrated in this thesis with
several figures on W3C's use-cases. Finally, a framework to define transformation rules is
added to the extensible optimizer to increase the XLive mediator performances. The XLive
mediation system has been developed at the PRiSM Laboratory.
Cette thèse propose un cadre d'évaluation pour des requêtes XQuery dans un
contexte de médiation de données XML. Un médiateur doit fédérer des sources de données
distribuées et hétérogènes. A cette fin, un modèle de représentation des requêtes est néces-
saire. Ce modèle doit intégrer les problèmes de médiation et permettre de définir un cadre
d'optimisation pour améliorer les performances. Le modèle des motifs d'arbre est souvent
utilisé pour représenter les requêtes XQuery, mais il ne reconnaît pas toutes les spécifica-
tions du langage. La complexité du langage XQuery fait qu'aucun modèle de représentation
complet n'a été proposé pour reconna^³tre toutes les spécifications. Ainsi, nous proposons un
nouveau modèle de représentation pour toutes les requêtes XQuery non typées que nous appe-
lons TGV. Avant de modéliser une requête, une étape de canonisation permet de produire une
forme canonique pour ces requêtes, facilitant l'étape de traduction vers le modèle TGV. Ce
modèle prend en compte le contexte de médiation et facilite l'étape d'optimisation. Les TGV
définis sous forme de Types Abstraits de Données facilitent l'intégration du modèle dans tout
système en fonction du modèle de données. De plus, une algèbre d'évaluation est définie pour
les TGV. Grâce µa l'intégration d'annotations et d'un cadre pour règles de transformation, un
optimiseur extensible manipule les TGV. Celui-ci repose sur des règles transformations, un
modèle de coût générique et une stratégie de recherche. Les TGV et l'optimiseur extensible
sont intégrés dans le médiateur XLive, développé au laboratoire PRiSM.

Domaines

Autre [cs.OH]
Fichier principal
Vignette du fichier
2006-12-06_these_travers_nicolas.pdf (1.51 Mo) Télécharger le fichier
2006-12-12_soutenance_nicolas_travers.pdf (2.83 Mo) Télécharger le fichier
Format : Autre

Dates et versions

tel-00131338 , version 1 (16-02-2007)

Identifiants

  • HAL Id : tel-00131338 , version 1

Citer

Nicolas Travers. Optimisation Extensible dans un Mediateur de Données Semi-Structurées. Autre [cs.OH]. Université de Versailles-Saint Quentin en Yvelines, 2006. Français. ⟨NNT : ⟩. ⟨tel-00131338⟩

Collections

CNRS UVSQ
278 Consultations
610 Téléchargements

Partager

Gmail Facebook X LinkedIn More