Vers une méthodologie d'optimisation du placement des objets DBAAS dans un environement de Cloud computing - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2019

Torward a methodology for optimizing DBAAS data objects placement in a Cloud computing environment

Vers une méthodologie d'optimisation du placement des objets DBAAS dans un environement de Cloud computing

Résumé

Les opérateurs de cloud DBaaS (Database as a Service) proposent à leurs clients des bases de données sous forme d’un service. L’explosion du marché du cloud les a contraints à optimiser très finement l’utilisation de leurs centres de données afin de proposer des services attractifs à moindre coût. Dans cette perspective, plusieurs technologies ont été utilisées pour optimiser les coûts tels que le coût de stockage (e.g. l’utilisation des systèmes de stockage hybride), le coût de calcul (e.g. la virtualisation) et le coût de maintenance (e.g. les applications multilocataire). Dans ce thèse, nous nous intéressons au système de stockage hybride HDD-SSD. En effet, les disques durs magnétiques (HDD) sont des supports de stockage à la fois énergivores et peu performants comparés aux unités de calcul. Néanmoins, leur prix par gigaoctet et leur longévité peuvent jouer en leur faveur. Contrairement aux HDD, les disques SSD à base de mémoire flash sont plus performants et consomment peu d’énergie. Leur prix élevé par gigaoctet et leur courte durée de vie (comparés aux HDD) représentent leurs contraintes majeures. De ce fait, les chercheurs ont suggéré l’utilisation de systèmes de stockage hybride HDD-SSD afin d’avoir les performances des SSD au prix des HDD. Cependant, l’adoption d’une telle technologie sans l’utilisation d’une stratégie de placement des objects adaptée pour les système de stockage hybride pourra seulement augmenter les coûts sans forcément aboutir à amélioration des performances. Il est donc nécessaire de concevoir des stratégies de placement qui gèrent le placement des objects et décident où et quand doit-on placer un objet dans une classe de stockage. Ces stratégies doivent être capables de gérer le mouvement des données entre les différentes classes de stockage en cas de fluctuation de la charge de travail. Nous prenons dans ce travail les bases de données relationnelles comme cas d’étude. Toutefois, nos approches sont applicables pour les bases de données NoSQL. Dans cette thèse nous introduisons un nouveau modèle autonomique d’optimisation de placement des objets de DBaaS inspiré de MAPE-K Monitor, Analyze, Plan, Execute, Knwoledge), et prenant en compte en plus des caractéristiques du Cloud, les E/S des objets ainsi que les systèmes de stockage associés. Notre première contribution consiste à proposer un modèle de coût étendu dont l’originalité consiste à prendre en compte le profil d’accès des objets, les caractéristiques du système de stockage, ainsi que les contraintes économiques de l’environnement cloud. Notre deuxième contribution consiste à proposer une stratégie de placement des objets de DBaaS dans un contexte de Cloud. Deux stratégies ont été proposées dans ce sens : La première, appelée Genetic Cost Based Object Placement Strategie (G-COPS), est basée sur une métaheuristique à savoir un algorithme génétique (GA), la deuxième approche est basée sur un algorithme heuristique incrémental ad-hoc appelée Heuristic Cost Based Object Placement Strategie (H-COPS).
DBaaS cloud providers offer the database as service. The growth and highly competitive nature of this economy has compelled them to optimize the use of their data centers, in order to offer attractive services at a lower cost. From this perspective, Several technologies and techniques have been designed to optimize costs such as the storage cost (e.g. the use of hybrid storage systems), the computing cost (e.g. virtualization) and the maintenance cost (e.g. multi-tenant). In this thesis, we are interested in hybrid storage system HDD-SSD. Indeed, Hard Disk Drives (HDD) represent energy-intensive an inefficient devices compared to compute units. However, their low cost per gigabyte and their long lifetime may constitute positive arguments. Unlike HDD, flash-based Solid-State Disks (SSD) are more efficient and consume less power, but their high cost per gigabyte and their short lifetime (compared to HDD) represent major constraints. The idea is to combine SSD and HDD seeking the performance of SSDs with the price of HDDs. However, adopting such a technology without the use of a object placement strategy suitable for hybrid storage systems will only increase the costs without necessarily leading to improved performance. It is therefore necessary to design placement strategies that manage the placement of objects and decide where and when to place an object in a storage class. These strategies must be able to manage the movement of data between different storage classes in the case of workloads fluctuating. In this work, we take relational databases as a case study. However, our approaches are applicable for NoSQL databases. In this thesis we propose a new autonomic model for object placement optimization based on MAPE-K (Monitor, Analyze, Plan, Execute, Knowledge) whereby in addition to the key aspects of Cloud computing paradigm, the Object I/O and related storage systems are considered. Our first contribution consist to propose a cost model which takes into account the object I/O profile, the storage system characteristics, and the cloud environment constraints. The second contribution consist to propose a Cost based Object Placement Strategies (COPS) on HSS for relational cloud DBMSs. We propose two strategies. The first one is a meta-heuristic approach based on a genetic algorithm (G-COPS). As metaheuristic algorithms are not always the best answer for optimization problems, we also propose a specialized heuristic-based solution (H-COPS). The idea of H-COPS consists in computing a first object placement solution and enhancing it incrementally based on the characteristics of the I/O workloads and customer penalties.
Fichier principal
Vignette du fichier
manuscrit.pdf (2.93 Mo) Télécharger le fichier
Origine : Fichiers produits par l'(les) auteur(s)
Loading...

Dates et versions

tel-02619323 , version 1 (25-05-2020)

Identifiants

  • HAL Id : tel-02619323 , version 1

Citer

Djillali Boukhelef. Vers une méthodologie d'optimisation du placement des objets DBAAS dans un environement de Cloud computing. Système d'exploitation [cs.OS]. USTHB, 2019. Français. ⟨NNT : ⟩. ⟨tel-02619323⟩
139 Consultations
184 Téléchargements

Partager

Gmail Facebook X LinkedIn More