Profiling and debugging by efficient tracing of hybrid multi-threaded HPC applications.

Résumé : L’évolution des supercalculateurs est à la source de défis logiciels et architecturaux. Dans la quête de puissance de calcul, l’interdépendance des éléments du processus de simulation devient de plus en plus impactante et requiert de nouvelles approches. Cette thèse se concentre sur le développement logiciel et particulièrement sur l’observation des programmes parallèles s’exécutant sur des milliers de cœurs. Dans ce but, nous décrivons d’abord le processus de développement de manière globale avant de présenter les outils existants et les travaux associés. Dans un second temps, nous détaillons notre contribution qui consiste d’une part en des outils de débogage et profilage par prise de traces, et d’autre part en leur évolution vers un couplage en ligne qui pallie les limitations d’entrées–sorties. Notre contribution couvre également la synchronisation des horloges pour la prise de traces avec la présentation d’un algorithme de synchronisation probabiliste dont nous avons quantifié l’erreur. En outre, nous décrivons un outil de caractérisation machine qui couvre l’aspect MPI. Un tel outil met en évidence la présence de bruit aussi bien sur les communications de type point-à-point que de type collective. Enfin, nous proposons et motivons une alternative à la collecte d’événements par prise de traces tout en préservant la granularité des événements et un impact réduit sur les performances, tant sur le volet utilisation CPU que sur les entrées–sorties.
Mots-clés : Débogage Profilage
Type de document :
Thèse
Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Versailles Saint Quentin en Yvelines, 2014. English
Liste complète des métadonnées

Littérature citée [133 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01102639
Contributeur : Jean-Baptiste Besnard <>
Soumis le : mardi 13 janvier 2015 - 11:50:15
Dernière modification le : jeudi 9 février 2017 - 15:46:25
Document(s) archivé(s) le : mardi 14 avril 2015 - 10:41:46

Fichier

Identifiants

  • HAL Id : tel-01102639, version 1

Collections

CEA | PRISM | UVSQ

Citation

Jean-Baptiste Besnard. Profiling and debugging by efficient tracing of hybrid multi-threaded HPC applications.. Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Versailles Saint Quentin en Yvelines, 2014. English. 〈tel-01102639〉

Partager

Métriques

Consultations de
la notice

283

Téléchargements du document

330