Performance Evaluation and Prediction of Parallel Applications

Georgios Markomanolis 1
1 AVALON - Algorithms and Software Architectures for Distributed and HPC Platforms
Inria Grenoble - Rhône-Alpes, LIP - Laboratoire de l'Informatique du Parallélisme
Résumé : L'analyse et la compréhension du comportement d'applications parallèles sur des plates-formes de calcul variées est un problème récurent de la communauté du calcul scientifique. Lorsque les environnements d'exécution ne sont pas disponibles, la simulation devient une approche raisonnable pour obtenir des indicateurs de performance objectifs et pour explorer plusieurs scénarios ``what-if?''. Dans cette thèse, nous présentons un environnement pour la simulation off-line d'applications écrites avec MPI. La principale originalité de notre travail par rapport aux travaux précédents réside dans la définition de traces indépendantes du temps. Elles permettent d'obtenir une extensibilité maximale puisque des ressources hétérogènes et distribuées peuvent être utilisées pour obtenir une trace. Nous proposons un format dans lequel pour chaque événement qui apparaît durant l'exécution d'une application, nous récupérons les informations sur le volume d'instructions pour une phase de calcul ou le nombre d'octets et le type d'une communication. Pour obtenir des traces indépendantes du temps lors de l'exécution d'applications MPI, nous devons les instrumenter pour récupérer les données requises. Il existe plusieurs outils d'instrumentation qui peuvent instrumenter une application. Nous proposons un système de notation qui correspond aux besoins de notre environnement et nous évaluons les outils d'instrumentation selon lui. De plus, nous introduisons un outil original appelé Minimal Instrumentation qui a été conçu pour répondre au besoins de notre environnement. Nous étudions plusieurs méthodes d'instrumentation et plusieurs stratégies d'acquisition. Nous détaillons les outils qui extraient les traces indépendantes du temps à partir des traces d'instrumentations de quelques outils de profiling connus. Enfin nous évaluons la procédure d'acquisition complète et présentons l'acquisition d'instances à grande échelle. Nous décrivons en détail la procédure pour fournir un fichier de plateforme simulée réaliste à notre outil d'exécution de traces qui prend en compte la topologie de la plateforme cible ainsi que la procédure de calibrage par rapport à l'application qui va être simulée. De plus, nous montrons que notre simulateur peut prédire les performances de certains benchmarks MPI avec moins de 11% d'erreur relative entre l'exécution réelle et la simulation pour les cas où il n'y a pas de problème de performance. Enfin, nous identifions les causes de problèmes de performances et nous proposons des solutions pour y remédier.
Type de document :
Thèse
Other [cs.OH]. Ecole normale supérieure de lyon - ENS LYON, 2014. English. <NNT : 2014ENSL0880>
Liste complète des métadonnées

https://tel.archives-ouvertes.fr/tel-00951125
Contributeur : Abes Star <>
Soumis le : lundi 24 février 2014 - 11:27:26
Dernière modification le : mercredi 23 novembre 2016 - 15:40:38
Document(s) archivé(s) le : samedi 24 mai 2014 - 11:05:14

Fichier

MARKOMANOLIS_Georgios_2014_The...
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-00951125, version 1

Collections

Citation

Georgios Markomanolis. Performance Evaluation and Prediction of Parallel Applications. Other [cs.OH]. Ecole normale supérieure de lyon - ENS LYON, 2014. English. <NNT : 2014ENSL0880>. <tel-00951125>

Partager

Métriques

Consultations de
la notice

470

Téléchargements du document

566