ScholarGate
Assistant

Calcul sur GPU et accélérateurs en physique

Les unités de traitement graphique et autres accélérateurs intègrent des milliers de cœurs légers qui excellent dans l'arithmétique massivement parallèle des données des simulations physiques, offrant des accélérations significatives pour la dynamique moléculaire, les calculs sur réseaux et sur grilles.

Trouver un sujet avec PaperMindBientôtFind papers & topics
Tools & resources
Télécharger les diapositives
Learn & explore
VidéoBientôt

Definition

Le calcul sur GPU et accélérateurs en physique désigne l'utilisation de coprocesseurs hautement parallèles dotés de nombreux cœurs simples pour exécuter les noyaux de calcul massivement parallèles aux données d'une simulation, atteignant un débit élevé pour des charges de travail physiques appropriées.

Scope

Ce sujet aborde le calcul sur accélérateurs pour la physique : le modèle GPU massivement parallèle aux données, la hiérarchie de la mémoire et l'importance des motifs d'accès à la mémoire, le mappage des noyaux de calcul physique tels que le calcul de forces et les mises à jour de stencils sur les accélérateurs, ainsi que les compromis de la programmation hétérogène CPU-GPU. Il traite à la fois de la performance et de la programmabilité.

Core questions

  • Pourquoi les GPU sont-ils adaptés à l'arithmétique massivement parallèle aux données de nombreuses simulations physiques ?
  • Comment la hiérarchie de la mémoire GPU influence-t-elle les performances réalisables ?
  • Quels noyaux de calcul physique se mappent bien sur les accélérateurs et lesquels ne le font pas ?
  • Comment les simulations hétérogènes CPU-GPU sont-elles organisées ?

Key theories

Exécution massivement parallèle aux données
Les GPU exécutent la même opération sur des milliers de threads sur des données différentes, ce qui correspond aux simulations où des mises à jour identiques sont appliquées à de nombreuses particules ou points de grille, générant ainsi des gains de débit importants.
Hiérarchie de la mémoire et motifs d'accès
La performance des GPU dépend de l'accès mémoire coalescent et de l'utilisation efficace de la mémoire rapide sur puce ; les algorithmes doivent donc être restructurés pour alimenter les nombreux cœurs en données plutôt que de les laisser bloqués par la mémoire.
Noyaux de calcul physique accélérés
L'évaluation des forces en dynamique moléculaire, les mises à jour de stencils dans les solveurs sur grille et les mises à jour de réseaux en théorie des champs ont été portés sur GPU pour des accélérations d'un ordre de grandeur, comme l'a démontré la dynamique moléculaire entièrement basée sur GPU des débuts.

Clinical relevance

L'accélération GPU est à la base d'une grande partie de la dynamique moléculaire moderne, de la chromodynamique quantique sur réseau et de la simulation astrophysique. Le même matériel sous-tend les flux de travail d'apprentissage automatique de plus en plus utilisés pour analyser et accélérer les calculs physiques.

History

Le calcul GPU à usage général a pris son essor à la fin des années 2000 avec les shaders programmables et la plateforme CUDA ; la physique a été un domaine précurseur, avec la dynamique moléculaire entièrement basée sur GPU en 2008, suivie par la chromodynamique quantique sur réseau accélérée par GPU, faisant des accélérateurs un standard dans les supercalculateurs.

Key figures

  • Wen-mei Hwu
  • David Kirk
  • Joshua Anderson

Related topics

Seminal works

  • kirkhwu2016
  • anderson2008

Frequently asked questions

Pourquoi les GPU sont-ils tellement plus rapides pour certains codes physiques mais pas pour d'autres ?
Les GPU excellent lorsque la même opération simple est appliquée à d'énormes quantités de données avec un accès mémoire régulier, comme dans les mises à jour de forces ou de stencils. Les codes avec de nombreux branchements, un accès mémoire irrégulier ou de grandes sections séquentielles ne bénéficient que de peu d'avantages et peuvent même s'exécuter plus lentement.
Les GPU remplacent-ils les CPU dans le calcul physique ?
Non. La plupart des grandes simulations sont hétérogènes, utilisant les GPU pour les noyaux de calcul massivement parallèles aux données, tandis que les CPU gèrent le flux de contrôle, la coordination et les tâches irrégulières ; les deux sont donc utilisés ensemble plutôt que l'un ne remplace l'autre.

Methods for this concept

Related concepts