Parallélisme et équilibrage de charges dans le traitement de la jointure sur des architectures distribuées.

Résumé : L'émergence des applications de bases de données dans les domaines tels que le data warehousing, le data mining et l'aide à la décision qui font généralement appel à de très grands volumes de données rend la parallélisation des algorithmes des jointures nécessaire pour avoir un temps de réponse acceptable. Une accélération linéaire est l'objectif principal des algorithmes parallèles, cependant dans les applications réelles, elle est difficilement atteignable : ceci est dû généralement d'une part aux coûts de communications inhérents aux systèmes multi-processeur et d'autre part au déséquilibre des charges des différents processeurs. En plus, dans un environnement hétérogène multi-utilisateur, la charge des différents processeurs peut varier de manière dynamique et imprévisible. Dans le cadre de cette thèse, nous nous intéressons au traitement de la jointure et de la multi-jointure sur les architectures distribuées hétérogènes, les grilles de calcul et les systèmes de fichiers distribués. Nous avons proposé une variété d'algorithmes, basés sur l'utilisation des histogrammes distribués, pour traiter de manière efficace le déséquilibre des données, tout en garantissant un équilibrage presque parfait de la charge des différents processeurs même dans un environnement hétérogène et multi-utilisateur. Ces algorithmes sont basés sur une approche dynamique de redistribution des données permettant de réduire les coûts de communication à un minimum tout en traitant de manière très efficace le problème de déséquilibre des valeurs de l'attribut de jointure. L'analyse de complexité de nos algorithmes et les résultats expérimentaux obtenus montrent que ces algorithmes possèdent une accélération presque linéaire.
Type de document :
Thèse
Informatique [cs]. Université d'Orléans, 2009. Français
Liste complète des métadonnées

Littérature citée [100 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00465073
Contributeur : Mohamad Al Hajj Hassan <>
Soumis le : jeudi 18 mars 2010 - 22:14:29
Dernière modification le : lundi 4 avril 2016 - 09:52:52
Document(s) archivé(s) le : vendredi 19 octobre 2012 - 10:10:53

Identifiants

  • HAL Id : tel-00465073, version 1

Citation

Mohamad Al Hajj Hassan. Parallélisme et équilibrage de charges dans le traitement de la jointure sur des architectures distribuées.. Informatique [cs]. Université d'Orléans, 2009. Français. 〈tel-00465073〉

Partager

Métriques

Consultations de la notice

692

Téléchargements de fichiers

630