Skip to Main content Skip to Navigation
Theses

Scheduling and memory optimizations for sparse direct solver on multi-core/multi-gpu duster systems

Xavier Lacoste 1, 2
Résumé : L’évolution courante des machines montre une croissance importante dans le nombre et l’hétérogénéité des unités de calcul. Les développeurs doivent alors trouver des alternatives aux modèles de programmation habituels permettant de produire des codes de calcul à la fois performants et portables. PaStiX est un solveur parallèle de système linéaire creux par méthodes directe. Il utilise un ordonnanceur de tâche dynamique pour être efficaces sur les machines modernes multi-coeurs à mémoires hiérarchiques. Dans cette thèse, nous étudions les bénéfices et les limites que peut nous apporter le remplacement de l’ordonnanceur interne, très spécialisé, du solveur PaStiX par deux systèmes d’exécution génériques : PaRSEC et StarPU. Pour cela l’algorithme doit être décrit sous la forme d’un graphe de tâches qui est fournit aux systèmes d’exécution qui peuvent alors calculer une exécution optimisée de celui-ci pour maximiser l’efficacité de l’algorithme sur la machine de calcul visée. Une étude comparativedes performances de PaStiX utilisant ordonnanceur interne, PaRSEC, et StarPU a été menée sur différentes machines et est présentée ici. L’analyse met en évidence les performances comparables des versions utilisant les systèmes d’exécution par rapport à l’ordonnanceur embarqué optimisé pour PaStiX. De plus ces implémentations permettent d’obtenir une accélération notable sur les machines hétérogènes en utilisant lesaccélérateurs tout en masquant la complexité de leur utilisation au développeur. Dans cette thèse nous étudions également la possibilité d’obtenir un solveur distribué de système linéaire creux par méthodes directes efficace sur les machines parallèles hétérogènes en utilisant les systèmes d’exécution à base de tâche. Afin de pouvoir utiliser ces travaux de manière efficace dans des codes parallèles de simulations, nous présentons également une interface distribuée, orientée éléments finis, permettant d’obtenir un assemblage optimisé de la matrice distribuée tout en masquant la complexité liée à la distribution des données à l’utilisateur.
Complete list of metadatas

https://tel.archives-ouvertes.fr/tel-01222565
Contributor : Abes Star :  Contact
Submitted on : Friday, October 30, 2015 - 11:12:07 AM
Last modification on : Wednesday, April 4, 2018 - 1:24:20 AM
Document(s) archivé(s) le : Friday, April 28, 2017 - 8:05:12 AM

File

LACOSTE_XAVIER_2015.pdf
Version validated by the jury (STAR)

Identifiers

  • HAL Id : tel-01222565, version 1

Collections

Citation

Xavier Lacoste. Scheduling and memory optimizations for sparse direct solver on multi-core/multi-gpu duster systems. Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Bordeaux, 2015. English. ⟨NNT : 2015BORD0016⟩. ⟨tel-01222565⟩

Share

Metrics

Record views

471

Files downloads

654