Skip to Main content Skip to Navigation
Theses

Minimizing communication for incomplete factorizations and low-rank approximations on large scale computers

Sébastien Cayrols 1
1 ALPINES - Algorithms and parallel tools for integrated numerical simulations
INSMI - Institut National des Sciences Mathématiques et de leurs Interactions, Inria de Paris, LJLL (UMR_7598) - Laboratoire Jacques-Louis Lions
Résumé : L’impact des communications sur les performances d’un code d’algèbre linéaire augmente avec le nombre de processeurs. Dans le contexte de la résolution de systèmes d’équations linéaires creux, la résolution de Ax = b, sur une machine composée de milliers de noeuds, nécessite la minimisation des communications dans le but d’atteindre une grande efficacité tant en terme de calcul qu’en terme d’énergie consommée. La factorisation LU, même incomplète, de la matrice A est connue pour être difficilement parallélisable. Ce manuscrit présente CA-ILU(k), un nouveau préconditionneur qui minimise les communications autant durant la phase de factorisation que durant son application à chaque itération d’un solveur tel que GMRES. L’idée est de considérer un sous-ensemble de lignes de A et de lui adjoindre des données de A tel que la factorisation du sous-ensemble, ainsi que l’application des facteurs obtenus, se fait sans communication. Les expériences réalisées montre que CA-ILU(k) rivalise avec les préconditionneurs Block Jacobi et Restricted Additive Schwarz en terme d’itérations. Nous présentons ensuite un algorithme de rang faible appelé la factorisation LU couplée à une permutation des lignes et des colonnes, LU- CRTP. Cet algorithme utilise une méthode par tournoi pour sélectionner un sous-ensemble de colonnes de A, permettant la factorisation par bloc de la matrice A permutée, ainsi qu’une approximation des valeurs singulières de A. Les test séquentiels puis parallèles ont permit de mettre en évidence que LU- CRTP retourne une approximation des valeurs singulières avec une erreur proche de celle obtenue par la factorisation QR révélant le rang de la matrice (RRQR). En outre, l’espace mémoire occupé par les facteurs de LU-CRTP est jusqu’à 200 fois plus faible que dans le cas de RRQR. Toujours dans le cadre d’une approximation de rang faible, nous proposons enfin une amélioration de la stratégie de pivotage par tournoi qui réduit le nombre d’opérations effectuées ainsi que les communications. Une colonne de A est retirée de la méthode si elle est une combinaison linéaire des autres colonnes de A, suivant un critère τ . Des tests sur un grand nombre de matrices montrent que cette modification ne dégrade pas significativement la précision de LU-CRTP. En outre, cette modification appliquée à la variante de RRQR minimisant les communications réduit par un facteur de 36 le nombre d’opérations.
Complete list of metadatas

Cited literature [86 references]  Display  Hide  Download

https://tel.archives-ouvertes.fr/tel-02437769
Contributor : Sebastien Cayrols <>
Submitted on : Monday, January 13, 2020 - 9:57:16 PM
Last modification on : Friday, April 10, 2020 - 5:20:11 PM
Document(s) archivé(s) le : Tuesday, April 14, 2020 - 7:26:44 PM

File

cayrols_thesis_v1.pdf
Files produced by the author(s)

Identifiers

  • HAL Id : tel-02437769, version 1

Citation

Sébastien Cayrols. Minimizing communication for incomplete factorizations and low-rank approximations on large scale computers. Mathematics [math]. Sorbonne Universites, UPMC University of Paris 6, 2019. English. ⟨tel-02437769⟩

Share

Metrics

Record views

67

Files downloads

83