Skip to Main content Skip to Navigation
Theses

Performance Analysis Strategies for Task-based Applications on Hybrid Platforms

Résumé : Dans le cadre du calcul haute performance, l’utilisation d’un modèle de programmation basé sur un parallélisme de tâche est de plus en plus courant. Cette approche permet de s’adapter plus facilement aux super-ordinateurs utilisant des architectures hybrides. La performance d’applications à bases de tâches dépend fortement des heuristiques d’ordonnancement dynamiques sous-jacente et de leur capacité à exploiter les ressources de calcul et de communication. Malheureusement, les stratégies d’analyse de performance traditionnelles ne sont pas adaptées à l’analyse de supports d’exécution dynamiques et d’applications basées sur des tâches. Ces stratégies supposent en général un comportement relativement régulier avec des alternances de phases de calcul et de communication alors que les applications basées sur des tâches ne présentent pas de structures aussi précises. Par ailleurs, l’asynchronisme et la granularité plus fine des applications basées sur des tâches induit des comportements stochastiques qui donnent lieu à des structures naturellement irrégulières qui sont difficiles à analyser. Dans cette thèse, nous proposons des stratégies d’analyse de performance qui exploitent à la fois la structure de l’application, des caractéristiques de l’ordonnancement et des informations de la plate-forme. Nous présentons comment nos stratégies peuvent aider à comprendre et résoudre des problèmes de performance non triviaux dans des applications basée sur des tâches qui s’exécutent sur des plates-formes hybrides. Nos stratégies d’analyse de performance sont construites à l’aide d’outils d’analyse de données génériques et modernes, ce qui permet de créer des vues spécifiques et adaptées. Ces vues permettent la compréhension et l’identification de problèmes de performances occasionnés par de mauvaises décisions d’ordonnancement ou bien des configurations incorrectes du support d’exécution et de la plate-forme. En combinant des techniques de simulation et de débogage à des vues spécifiquement développées pour représenter l’état interne de l’ordonnanceur et qui le conduisent à prendre ses décisions, nous avons montré qu’il était possible d’évaluer certaines hypothèses sur la pertinence de ses choix. Nous validons notre proposition en analysant de nombreuses traces d’exécutions d’une factorisation de Cholesky implémenté avec le support d’exécution StarPU et exécutée sur différentes plates-formes hybrides (CPU/GPU). Nos études de cas montrent comment améliorer la partition des tâches entre les différents cœurs et GPUS pour s’approcher des bornes inférieures théoriques, comment améliorer le pipeline des opérations MPI entre les différents nœuds (multi-coeurs et multi-GPUs) pour accélérer le démarrage de l’application, et comment améliorer le support d’exécution pour augmenter la bande passante MPI. L’emploi des stratégies de simulation et débogage, nous fournissons une approche permettant d’examiner, en détail, les décisions d’ordonnancement et ainsi de proposer des améliorations des mécanismes d’ordonnancement et de prefetch du support d’exécution.
Complete list of metadatas

https://tel.archives-ouvertes.fr/tel-01962333
Contributor : Arnaud Legrand <>
Submitted on : Monday, January 14, 2019 - 1:57:44 PM
Last modification on : Wednesday, August 5, 2020 - 3:01:53 AM
Document(s) archivé(s) le : Monday, April 15, 2019 - 12:21:34 PM

File

001083965-joined.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-01962333, version 1

Citation

Vinícius Garcia Pinto. Performance Analysis Strategies for Task-based Applications on Hybrid Platforms. Distributed, Parallel, and Cluster Computing [cs.DC]. Universidade Federal do Rio Grande do Sul - UFRGS; UGA - Université Grenoble Alpes, 2018. English. ⟨tel-01962333⟩

Share

Metrics

Record views

147

Files downloads

532