Pourquoi les GPU sont-ils tellement plus rapides pour certains codes physiques mais pas pour d'autres ?

Les GPU excellent lorsque la même opération simple est appliquée à d'énormes quantités de données avec un accès mémoire régulier, comme dans les mises à jour de forces ou de stencils. Les codes avec de nombreux branchements, un accès mémoire irrégulier ou de grandes sections séquentielles ne bénéficient que de peu d'avantages et peuvent même s'exécuter plus lentement.

Les GPU remplacent-ils les CPU dans le calcul physique ?

Non. La plupart des grandes simulations sont hétérogènes, utilisant les GPU pour les noyaux de calcul massivement parallèles aux données, tandis que les CPU gèrent le flux de contrôle, la coordination et les tâches irrégulières ; les deux sont donc utilisés ensemble plutôt que l'un ne remplace l'autre.

Calcul sur GPU et accélérateurs en physique

Les unités de traitement graphique et autres accélérateurs intègrent des milliers de cœurs légers qui excellent dans l'arithmétique massivement parallèle des données des simulations physiques, offrant des accélérations significatives pour la dynamique moléculaire, les calculs sur réseaux et sur grilles.

Trouver un sujet avec PaperMindBientôtFind papers & topics

Tools & resources

Télécharger les diapositives

Learn & explore

VidéoBientôt

Definition

Le calcul sur GPU et accélérateurs en physique désigne l'utilisation de coprocesseurs hautement parallèles dotés de nombreux cœurs simples pour exécuter les noyaux de calcul massivement parallèles aux données d'une simulation, atteignant un débit élevé pour des charges de travail physiques appropriées.

Scope

Ce sujet aborde le calcul sur accélérateurs pour la physique : le modèle GPU massivement parallèle aux données, la hiérarchie de la mémoire et l'importance des motifs d'accès à la mémoire, le mappage des noyaux de calcul physique tels que le calcul de forces et les mises à jour de stencils sur les accélérateurs, ainsi que les compromis de la programmation hétérogène CPU-GPU. Il traite à la fois de la performance et de la programmabilité.

Core questions

Pourquoi les GPU sont-ils adaptés à l'arithmétique massivement parallèle aux données de nombreuses simulations physiques ?
Comment la hiérarchie de la mémoire GPU influence-t-elle les performances réalisables ?
Quels noyaux de calcul physique se mappent bien sur les accélérateurs et lesquels ne le font pas ?
Comment les simulations hétérogènes CPU-GPU sont-elles organisées ?

Key theories

Exécution massivement parallèle aux données: Les GPU exécutent la même opération sur des milliers de threads sur des données différentes, ce qui correspond aux simulations où des mises à jour identiques sont appliquées à de nombreuses particules ou points de grille, générant ainsi des gains de débit importants.
Hiérarchie de la mémoire et motifs d'accès: La performance des GPU dépend de l'accès mémoire coalescent et de l'utilisation efficace de la mémoire rapide sur puce ; les algorithmes doivent donc être restructurés pour alimenter les nombreux cœurs en données plutôt que de les laisser bloqués par la mémoire.
Noyaux de calcul physique accélérés: L'évaluation des forces en dynamique moléculaire, les mises à jour de stencils dans les solveurs sur grille et les mises à jour de réseaux en théorie des champs ont été portés sur GPU pour des accélérations d'un ordre de grandeur, comme l'a démontré la dynamique moléculaire entièrement basée sur GPU des débuts.

Clinical relevance

L'accélération GPU est à la base d'une grande partie de la dynamique moléculaire moderne, de la chromodynamique quantique sur réseau et de la simulation astrophysique. Le même matériel sous-tend les flux de travail d'apprentissage automatique de plus en plus utilisés pour analyser et accélérer les calculs physiques.

History

Le calcul GPU à usage général a pris son essor à la fin des années 2000 avec les shaders programmables et la plateforme CUDA ; la physique a été un domaine précurseur, avec la dynamique moléculaire entièrement basée sur GPU en 2008, suivie par la chromodynamique quantique sur réseau accélérée par GPU, faisant des accélérateurs un standard dans les supercalculateurs.

Key figures

Wen-mei Hwu
David Kirk
Joshua Anderson

Seminal works

kirkhwu2016
anderson2008

Frequently asked questions

Pourquoi les GPU sont-ils tellement plus rapides pour certains codes physiques mais pas pour d'autres ?: Les GPU excellent lorsque la même opération simple est appliquée à d'énormes quantités de données avec un accès mémoire régulier, comme dans les mises à jour de forces ou de stencils. Les codes avec de nombreux branchements, un accès mémoire irrégulier ou de grandes sections séquentielles ne bénéficient que de peu d'avantages et peuvent même s'exécuter plus lentement.
Les GPU remplacent-ils les CPU dans le calcul physique ?: Non. La plupart des grandes simulations sont hétérogènes, utilisant les GPU pour les noyaux de calcul massivement parallèles aux données, tandis que les CPU gèrent le flux de contrôle, la coordination et les tâches irrégulières ; les deux sont donc utilisés ensemble plutôt que l'un ne remplace l'autre.