Proposition d'un cadre générique d'optimisation de requêtes dans les environnements hétérogènes et répartis - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2011

On a generic query optimization framework in heterogeneous and distributed environments

Proposition d'un cadre générique d'optimisation de requêtes dans les environnements hétérogènes et répartis

Résumé

This thesis proposes a generic framework for query optimization in heterogeneous and distributed environments. We propose a generic source description model (GSD), which allows describing any type of information related to query processing and optimization. With GSD, we can use cost information to calculate the costs of execution plans. Our generic framework for query optimization provides a set of unitary functions used to perform optimization by applying different search strategies. Our experimental results show the accuracy of cost calculus when using GSD, and the flexibility of our generic framework when changing search strategies. Our proposed approach has been implemented and integrated in a data integration product (DVS) licensed by Xcalia - Progress Software Corporation. For queries with many inter-site joins accessing large size data sources, the time used for finding the optimal plan is in the order of 2 seconds, and the execution time of the optimized plan is reduced by 28 times, as compared with the execution time of the non optimized original plan.
Dans cette thèse, nous proposons un cadre générique d'optimisation de requêtes dans les environnements hétérogènes répartis. Nous proposons un modèle générique de description de sources (GSD), qui permet de décrire tous les types d'informations liées au traitement et à l'optimisation de requêtes. Avec ce modèle, nous pouvons en particulier obtenir les informations de coût afin de calculer le coût des différents plans d'exécution. Notre cadre générique d'optimisation fournit les fonctions unitaires permettant de mettre en œuvre les procédures d'optimisation en appliquant différentes stratégies de recherche. Nos résultats expérimentaux mettent en évidence la précision du calcul de coût avec le modèle GSD et la flexibilité de notre cadre générique d'optimisation lors du changement de stratégie de recherche. Notre cadre générique d'optimisation a été mis en œuvre et intégré dans un produit d'intégration de données (DVS) commercialisé par l'entreprise Xcalia - Progress Software Corporation. Pour des requêtes contenant beaucoup de jointures inter-site et interrogeant des sources de grand volume, le temps de calcul du plan optimal est de l'ordre de 2 secondes et le temps d'exécution du plan optimal est réduit de 28 fois par rapport au plan initial non optimisé.
Fichier principal
Vignette du fichier
These_Liu.pdf (2.54 Mo) Télécharger le fichier
Loading...

Dates et versions

tel-00659670 , version 1 (13-01-2012)

Identifiants

  • HAL Id : tel-00659670 , version 1

Citer

Tianxiao Liu. Proposition d'un cadre générique d'optimisation de requêtes dans les environnements hétérogènes et répartis. Base de données [cs.DB]. Université de Cergy Pontoise, 2011. Français. ⟨NNT : ⟩. ⟨tel-00659670⟩
307 Consultations
1215 Téléchargements

Partager

Gmail Facebook X LinkedIn More