Automatic code generation and optimization of multi-dimensional stencil computations on distributed-memory architectures - TEL - Thèses en ligne Accéder directement au contenu
Thèse Année : 2018

Automatic code generation and optimization of multi-dimensional stencil computations on distributed-memory architectures

Génération automatique de code et optimisation de calculs stencils sur des architectures à mémoire distribuée

Résumé

In this work, we present Dido, an implicitly parallel domain-specific language (DSL) that captures high-level stencil abstractions and automatically generates high-performance parallel stencil code for distributed-memory architectures. The generated code uses ORWL as a communication and synchronization backend. We show that Dido achieves a huge progress in terms of programmer productivity without sacrificing the performance. Dido supports a wide range of stencil computations and real-world stencil-based applications. We show that the well-structured code generated by Dido lends itself to different possible optimizations and study the performance of two of them. We also combine Dido's code generation technique with the polyhedral loop optimizer Pluto to increase data locality and improve intra-node data reuse. We present experiments that prove the efficiency and scalability of the generated code that outperforms both ORWL and MPI hand-crafted implementations.
Nous proposons Dido, un langage dédié (DSL) implicitement parallèle qui capture les spécifications de haut niveau des stencils et génère automatiquement du code parallèle de haute performance pour les architectures à mémoire distribuée. Le code généré utilise ORWL en tant que interface de communication et runtime. Nous montrons que Dido réalise un grand progrès en termes de productivité sans sacrifier les performances. Dido prend en charge une large gamme de calculs stencils ainsi que des applications réelles à base de stencils. Nous montrons que le code généré par Dido est bien structuré et se prête à de différentes optimisations possibles. Nous combinons également la technique de génération de code de Dido avec Pluto l'optimiseur polyédrique de boucles pour améliorer la localité des données. Nous présentons des expériences qui prouvent l'efficacité et la scalabilité du code généré qui atteint de meilleures performances que les implémentations ORWL et MPI écrites à la main.
Fichier principal
Vignette du fichier
Saied_Mariem_2018_ED269.pdf (2.07 Mo) Télécharger le fichier
Origine : Version validée par le jury (STAR)
Loading...

Dates et versions

tel-02166980 , version 1 (27-06-2019)

Identifiants

  • HAL Id : tel-02166980 , version 1

Citer

Mariem Saied. Automatic code generation and optimization of multi-dimensional stencil computations on distributed-memory architectures. Distributed, Parallel, and Cluster Computing [cs.DC]. Université de Strasbourg, 2018. English. ⟨NNT : 2018STRAD036⟩. ⟨tel-02166980⟩
147 Consultations
323 Téléchargements

Partager

Gmail Facebook X LinkedIn More