Scheduling of Dense Linear Algebra Kernels on Heterogeneous Resources

Suraj Kumar 1, 2, 3, 4
3 Realopt - Reformulations based algorithms for Combinatorial Optimization
LaBRI - Laboratoire Bordelais de Recherche en Informatique, IMB - Institut de Mathématiques de Bordeaux, Inria Bordeaux - Sud-Ouest
4 STORM - STatic Optimizations, Runtime Methods
LaBRI - Laboratoire Bordelais de Recherche en Informatique, Inria Bordeaux - Sud-Ouest
Résumé : Du fait des énormes capacités de calculs des accélérateurs tels que les GPUs et les Xeon Phi, l’utilisation de machines multicoques pourvues d’accélérateurs est devenue commune dans le domaine du calcul haute performance (HPC). La complexité induite par ces accélérateurs a suscité le développement de systèmes d’exécution à base de tâches, dans lesquels les dépendances entre les applications sont exprimées sous la forme de graphe de tâches et où les tâches sont ordonnancées dynamiquement sur les ressources de calcul. La difficulté est alors de concevoir des stratégies d’ordonnancement qui font une utilisation efficace des ressources de calculs et le développement de telles stratégies, même pour un unique noeud hybride, est un enjeu essentiel de la performance des systèmes HPC. Nous considérons dans cette thèse l’ordonnancement de noyaux d’algèbre linéaire dense sur des noeuds complètement hétérogènes et constitués de CPUs et de GPUs. Les performances relatives des accélérateurs par rapport aux coeurs classique dépend très fortement du noyau considéré. Par exemple, les accélérateurs sont beaucoup plus efficaces pour les produits de matrices, par exemple, que pour les factorisations. Dans cette thèse, nous analysons les performances de stratégies statiques et dynamiques d’ordonnancement et nous proposons un ensemble de stratégies intermédiaires, en ajoutant des composantes statiques (respectivement dynamiques) à des stratégies d’ordonnancements dynamique (respectivement statiques). Récemment, une stratégie appelée HeteroPrio a été proposée, qui s’appuie sur les affinités entre les tâches et les ressources pour un petit ensemble de tâches différentes s’exécutant sur deux types de ressources. Nous avons étendu cette stratégie d’ordonnancement pour des graphes de tâches généraux pour deux types de ressources puis pour plus de deux types. De manière complémentaire, nous avons également démontré des facteurs d’approximation et des pires cas pour HeteroPrio dans le cas d’un ensemble de tâches indépendantes sur différents types de plates-formes.
Type de document :
Thèse
Other [cs.OH]. Université de Bordeaux, 2017. English. 〈NNT : 2017BORD0572〉
Liste complète des métadonnées

Littérature citée [95 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01538516
Contributeur : Abes Star <>
Soumis le : mardi 13 juin 2017 - 16:26:06
Dernière modification le : jeudi 12 avril 2018 - 01:57:35
Document(s) archivé(s) le : mardi 12 décembre 2017 - 18:19:19

Fichier

KUMAR_SURAL_2017.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01538516, version 1

Citation

Suraj Kumar. Scheduling of Dense Linear Algebra Kernels on Heterogeneous Resources. Other [cs.OH]. Université de Bordeaux, 2017. English. 〈NNT : 2017BORD0572〉. 〈tel-01538516〉

Partager

Métriques

Consultations de la notice

381

Téléchargements de fichiers

175