P2P-MPI : A fault-tolerant Message Passing Interface Implementation for Grids

Résumé : Cette thèse démontre la faisabilité d'un intergiciel destiné aux grilles de calcul, prenant en compte la dynamicité de ce type de plateforme, et les impératifs des programmes parallèles à passage de message. Pour cela, nous mettons en avant l'intérêt d'utiliser une architecture la plus distribuée possible : nous reprenons l'idée d'une infrastructure pair-à-pair pour l'organisation des ressources, qui facilite notamment la découverte des ressources, et nous retenons les détecteurs de défaillance distribués pour gérer la tolérance aux pannes. La dynamicité de ce type d'environnement est également un problème pour le modèle d'exécution sous-jacent à MPI, car la panne d'un seul processus entraine l'arrêt de l'application. La contribution de P2P-MPI dans ce domaine est la tolérance aux pannes par réplication. Nous pensons qu'elle est la mieux adaptée à une architecture pair-à-pair, les techniques classiques basées sur le check-point and restart nécessitant un ou des serveurs de sauvegardes. De plus, la réplication est totalement transparente à l'utilisateur et rejoint ainsi l'objectif de simplicité d'utilisation que nous nous sommes fixés. Nous pensons que garder un environnement très simple d'utilisation, entièrement maîtrisable par un utilisateur, est un des facteurs permettant d'augmenter le nombre de ressources disponibles sur la grille. Enfin, la contribution majeure de P2P-MPI est la librairie de communication proposée, qui est une implémentation de MPJ (MPI adapté à Java), et qui intègre la réplication des processus. Ce point particulier de notre travail plaide pour une collaboration étroite entre l'intergiciel, qui connaît l'état de la grille (détection des pannes par exemple) et la couche de communication qui peut adapter son comportement en connaissance de cause.
Type de document :
Thèse
Distributed, Parallel, and Cluster Computing [cs.DC]. Université Louis Pasteur - Strasbourg I, 2008. English
Liste complète des métadonnées

Littérature citée [8 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-00724132
Contributeur : Stéphane Genaud <>
Soumis le : samedi 18 août 2012 - 01:24:04
Dernière modification le : vendredi 12 janvier 2018 - 01:09:25
Document(s) archivé(s) le : lundi 19 novembre 2012 - 02:20:22

Identifiants

  • HAL Id : tel-00724132, version 1

Collections

Citation

Choopan Rattanapoka. P2P-MPI : A fault-tolerant Message Passing Interface Implementation for Grids. Distributed, Parallel, and Cluster Computing [cs.DC]. Université Louis Pasteur - Strasbourg I, 2008. English. 〈tel-00724132〉

Partager

Métriques

Consultations de la notice

268

Téléchargements de fichiers

181