Composability of parallel codes on heterogeneous architectures

Résumé : Pour répondre aux besoins de précision et d'efficacité des simulations scientifiques, la communauté du Calcul Haute Performance augmente progressivement les demandes en terme de parallélisme, rajoutant ainsi un besoin croissant de réutiliser les bibliothèques parallèles optimisées pour les architectures complexes.L'utilisation simultanée de plusieurs bibliothèques de calcul parallèle au sein d'une application soulève bien souvent des problèmes d 'efficacité. En compétition pour l'obtention des ressources, les routines parallèles, pourtant optimisées, se gênent et l'on voit alors apparaître des phénomènes de surcharge, de contention ou de défaut de cache.Dans cette thèse, nous présentons une technique de cloisonnement de flux de calculs qui permet de limiter les effets de telles interférences. Le cloisonnement est réalisé à l'aide de contextes d'exécution qui partitionnement les unités de calculs voire en partagent certaines. La répartition des ressources entre les contextes peut être modifiée dynamiquement afin d'optimiser le rendement de la machine. A cette fin, nous proposons l'utilisation de certaines métriques par un superviseur pour redistribuer automatiquement les ressources aux contextes. Nous décrivons l'intégration des contextes d'ordonnancement au support d'exécution pour machines hétérogènes StarPU et présentons des résultats d'expériences démontrant la pertinence de notre approche. Dans ce but, nous avons implémenté une extension du solveur direct creux qr mumps dans la quelle nous avons fait appel à ces mécanismes d'allocation de ressources. A travers les contextes d'ordonnancement nous décrivons une nouvelle méthode de décomposition du problème basée sur un algorithme de \proportional mapping". Le superviseur permet de réadapter dynamiquement et automatiquement l'allocation des ressources au parallèlisme irrégulier de l'application. L'utilisation des contextes d'ordonnancement et du superviseur a amélioré la localité et la performance globale du solveur.
Type de document :
Thèse
Computer science. Université de Bordeaux, 2014. English. 〈NNT : 2014BORD0373〉
Liste complète des métadonnées

Littérature citée [55 références]  Voir  Masquer  Télécharger

https://tel.archives-ouvertes.fr/tel-01162975
Contributeur : Abes Star <>
Soumis le : jeudi 11 juin 2015 - 17:47:05
Dernière modification le : mercredi 4 avril 2018 - 01:24:20
Document(s) archivé(s) le : mardi 25 avril 2017 - 07:05:09

Fichier

HUGO_ANDRA_2014.pdf
Version validée par le jury (STAR)

Identifiants

  • HAL Id : tel-01162975, version 1

Citation

Andra-Ecaterina Hugo. Composability of parallel codes on heterogeneous architectures. Computer science. Université de Bordeaux, 2014. English. 〈NNT : 2014BORD0373〉. 〈tel-01162975〉

Partager

Métriques

Consultations de la notice

341

Téléchargements de fichiers

535