कुछ भौतिकी कोड के लिए GPU इतने तेज़ क्यों होते हैं लेकिन दूसरों के लिए नहीं?

GPU तब उत्कृष्ट प्रदर्शन करते हैं जब एक ही सरल ऑपरेशन को नियमित मेमोरी एक्सेस के साथ बड़ी मात्रा में डेटा पर लागू किया जाता है, जैसे कि बल या स्टेंसिल अपडेट में। भारी ब्रांचिंग (branching), अनियमित मेमोरी एक्सेस या बड़े सीरियल सेक्शन वाले कोड को बहुत कम लाभ होता है और वे धीमे भी चल सकते हैं।

क्या GPU भौतिकी कंप्यूटिंग में CPU की जगह लेते हैं?

नहीं। अधिकांश बड़े सिमुलेशन विषम होते हैं, भारी डेटा-पैरेलल कर्नेल के लिए GPU का उपयोग करते हैं जबकि CPU नियंत्रण प्रवाह (control flow), समन्वय और अनियमित कार्य को संभालते हैं, इसलिए दोनों का उपयोग एक साथ किया जाता है बजाय एक दूसरे की जगह लेने के।

भौतिकी में GPU और एक्सेलेरेटर कंप्यूटिंग

ग्राफिक्स प्रोसेसिंग यूनिट (Graphics processing units) और अन्य एक्सेलेरेटर हजारों हल्के कोर पैक करते हैं जो भौतिकी सिमुलेशन के डेटा-पैरेलल अंकगणित में उत्कृष्ट प्रदर्शन करते हैं, आणविक गतिशीलता (molecular dynamics), लैटिस (lattice) और ग्रिड संगणनाओं के लिए बड़ी गति वृद्धि प्रदान करते हैं।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

भौतिकी में GPU और एक्सेलेरेटर कंप्यूटिंग एक सिमुलेशन के डेटा-पैरेलल कर्नेल को निष्पादित करने के लिए कई सरल कोर वाले अत्यधिक समानांतर सह-प्रोसेसरों (highly parallel coprocessors) का उपयोग है, जो उपयुक्त भौतिकी वर्कलोड पर उच्च थ्रूपुट (throughput) प्राप्त करता है।

Scope

यह विषय भौतिकी के लिए एक्सेलेरेटर कंप्यूटिंग को कवर करता है: बड़े पैमाने पर डेटा-पैरेलल GPU मॉडल, मेमोरी पदानुक्रम (memory hierarchy) और मेमोरी-एक्सेस पैटर्न का महत्व, बल संगणना (force computation) और स्टेंसिल अपडेट (stencil updates) जैसे भौतिकी कर्नेल (kernels) को एक्सेलेरेटर पर मैप करना, और विषम CPU-GPU प्रोग्रामिंग के फायदे और नुकसान। यह प्रदर्शन और प्रोग्रामेबिलिटी दोनों को संबोधित करता है।

Core questions

GPU कई भौतिकी सिमुलेशन के डेटा-पैरेलल अंकगणित के लिए क्यों उपयुक्त हैं?
GPU मेमोरी पदानुक्रम प्राप्त करने योग्य प्रदर्शन को कैसे आकार देता है?
कौन से भौतिकी कर्नेल एक्सेलेरेटर पर अच्छी तरह से मैप होते हैं और कौन से नहीं?
विषम CPU-GPU सिमुलेशन कैसे व्यवस्थित किए जाते हैं?

Key theories

बड़े पैमाने पर डेटा-पैरेलल निष्पादन: GPU विभिन्न डेटा पर हजारों थ्रेड्स में एक ही ऑपरेशन चलाते हैं, जो उन सिमुलेशन से मेल खाते हैं जहां कई कणों या ग्रिड बिंदुओं पर समान अपडेट लागू किए जाते हैं, जिससे बड़े थ्रूपुट लाभ मिलते हैं।
मेमोरी पदानुक्रम और एक्सेस पैटर्न: GPU प्रदर्शन समेकित मेमोरी एक्सेस (coalesced memory access) और तेज़ ऑन-चिप मेमोरी के प्रभावी उपयोग पर निर्भर करता है, इसलिए एल्गोरिदम को इस तरह से पुनर्गठित किया जाना चाहिए ताकि कई कोर को डेटा मिलता रहे बजाय मेमोरी पर रुकने के।
त्वरित भौतिकी कर्नेल: आणविक गतिशीलता में बल मूल्यांकन (force evaluation), ग्रिड सॉल्वर में स्टेंसिल अपडेट (stencil updates) और क्षेत्र सिद्धांत में लैटिस अपडेट (lattice updates) को परिमाण के क्रम में गति वृद्धि के लिए GPU में पोर्ट किया गया है, जैसा कि प्रारंभिक पूरी तरह से GPU-आधारित आणविक गतिशीलता द्वारा प्रदर्शित किया गया है।

Clinical relevance

GPU त्वरण आधुनिक आणविक गतिशीलता, लैटिस क्वांटम क्रोमोडायनामिक्स (lattice quantum chromodynamics) और खगोल भौतिकी सिमुलेशन के अधिकांश हिस्से को शक्ति प्रदान करता है, और यही हार्डवेयर मशीन-लर्निंग वर्कफ़्लो (machine-learning workflows) का आधार है जिसका उपयोग भौतिकी संगणनाओं का विश्लेषण और त्वरण करने के लिए तेजी से किया जा रहा है।

History

सामान्य-उद्देश्य GPU कंप्यूटिंग 2000 के दशक के अंत में प्रोग्रामेबल शेडर (programmable shaders) और CUDA प्लेटफॉर्म के साथ शुरू हुई; भौतिकी एक प्रारंभिक अपनाने वाला था, जिसमें 2008 में पूरी तरह से GPU-आधारित आणविक गतिशीलता और उसके बाद GPU-त्वरित लैटिस क्वांटम क्रोमोडायनामिक्स आया, जिससे एक्सेलेरेटर सुपरकंप्यूटर में मानक बन गए।

Key figures

Wen-mei Hwu
David Kirk
Joshua Anderson

Seminal works

kirkhwu2016
anderson2008

Frequently asked questions

कुछ भौतिकी कोड के लिए GPU इतने तेज़ क्यों होते हैं लेकिन दूसरों के लिए नहीं?: GPU तब उत्कृष्ट प्रदर्शन करते हैं जब एक ही सरल ऑपरेशन को नियमित मेमोरी एक्सेस के साथ बड़ी मात्रा में डेटा पर लागू किया जाता है, जैसे कि बल या स्टेंसिल अपडेट में। भारी ब्रांचिंग (branching), अनियमित मेमोरी एक्सेस या बड़े सीरियल सेक्शन वाले कोड को बहुत कम लाभ होता है और वे धीमे भी चल सकते हैं।
क्या GPU भौतिकी कंप्यूटिंग में CPU की जगह लेते हैं?: नहीं। अधिकांश बड़े सिमुलेशन विषम होते हैं, भारी डेटा-पैरेलल कर्नेल के लिए GPU का उपयोग करते हैं जबकि CPU नियंत्रण प्रवाह (control flow), समन्वय और अनियमित कार्य को संभालते हैं, इसलिए दोनों का उपयोग एक साथ किया जाता है बजाय एक दूसरे की जगह लेने के।