وحدات معالجة الرسوميات (GPU) والحوسبة المسرّعة
تستفيد وحدات معالجة الرسوميات (GPU) والحوسبة المسرّعة من المعالجات المتوازية الضخمة متعددة النوى لتسريع أعباء العمل المتوازية للبيانات بما يتجاوز بكثير ما تحققه وحدات المعالجة المركزية (CPU) للأغراض العامة.
Definition
الحوسبة باستخدام وحدات معالجة الرسوميات والمسرّعات هي استخدام معالجات متخصصة متعددة النوى، محسّنة للتنفيذ المتوازي للبيانات عالي الإنتاجية، لتفريغ وتسريع الأجزاء القابلة للتوازي من عملية حسابية ضمن نموذج برمجة المضيف-الجهاز.
Scope
يغطي هذا الموضوع بنية وحدات معالجة الرسوميات والمسرّعات الأخرى كآلات SIMD/SIMT متعددة النوى وموجهة نحو الإنتاجية؛ ونماذج البرمجة التي تستهدفها (CUDA و OpenCL والتفريغ المعتمد على التوجيهات)؛ وتجريدات التسلسل الهرمي للخيوط والذاكرة (الخيوط، مجموعات الخيوط (warps)، الكتل، الشبكات؛ الذاكرة الشاملة والمشتركة وذاكرة السجلات)؛ واعتبارات الأداء — الإشغال، تجميع الذاكرة، والتباعد — التي تحكم الإنتاجية القابلة للتحقيق.
Core questions
- كيف يختلف نموذج المسرّع متعدد النوى الموجه نحو الإنتاجية عن وحدة المعالجة المركزية للأغراض العامة؟
- كيف يتم التعبير عن العمليات الحسابية كنواة متوازية ضخمة عبر تسلسل هرمي للخيوط؟
- ما هي سلوكيات الذاكرة والتنفيذ — التجميع، التباعد، الإشغال — التي تحد من الأداء القابل للتحقيق؟
Key theories
- نموذج تنفيذ SIMT
- تقوم وحدات معالجة الرسوميات بتشغيل آلاف الخيوط خفيفة الوزن المجمعة في مجموعات (warps) تعمل بشكل متزامن (تعليمات واحدة، خيوط متعددة)؛ ويعتمد الأداء على إبقاء المجموعات مشغولة وتجنب تباعد تدفق التحكم داخل المجموعة.
- نموذج الخيوط والذاكرة الهرمي
- ينظم CUDA الخيوط في كتل وشبكات ويكشف عن تسلسل هرمي للذاكرة يتكون من السجلات، والذاكرة المشتركة السريعة، والذاكرة الشاملة الكبيرة؛ ويُعد ربط البيانات والحسابات بهذا التسلسل الهرمي هو المهمة الأساسية للأداء.
- الحوسبة باستخدام وحدات معالجة الرسوميات للأغراض العامة
- أدى التطور من خطوط أنابيب الرسوميات ذات الوظائف الثابتة إلى مسرّعات قابلة للبرمجة للأغراض العامة إلى تحويل وحدات معالجة الرسوميات إلى منصة رئيسية للحوسبة العلمية وكثيفة البيانات.
Clinical relevance
تُعد المسرّعات هي أساس التطبيقات الحديثة كثيفة الحوسبة: يعتمد تدريب التعلم العميق والاستدلال، والمحاكاة العلمية، ومعالجة الصور والإشارات، والتشفير جميعها على وحدات معالجة الرسوميات لتحقيق تسريع بمقدار كبير مقارنة بوحدات المعالجة المركزية.
History
تطورت وحدات معالجة الرسوميات من أجهزة رسوميات ذات وظائف ثابتة إلى معالجات متوازية قابلة للبرمجة؛ وقد أتاح إصدار CUDA عام 2007، الذي وصفه نيكولز وزملاؤه في عام 2008، إمكانية الوصول إلى حوسبة وحدات معالجة الرسوميات للأغراض العامة، وأصبحت المسرّعات لاحقًا محورية في الحوسبة عالية الأداء والتعلم الآلي.
Key figures
- John Nickolls
- Wen-mei Hwu
- David Kirk
- John Owens
Related topics
Seminal works
- nickolls2008
- kirk2016
- owens2008
Frequently asked questions
- لماذا تعد وحدات معالجة الرسوميات أسرع بكثير من وحدات المعالجة المركزية لبعض أعباء العمل؟
- تخصص وحدات معالجة الرسوميات جزءًا أكبر بكثير من ترانزستوراتها لوحدات الحساب وتشغل آلاف الخيوط لإخفاء زمن انتقال الذاكرة، مما يوازن سرعة الخيط الواحد بإنتاجية إجمالية. وهذا يجعلها ممتازة للعمل المنتظم والمتوازي للبيانات بشكل كبير، على الرغم من أنها غير مناسبة للتعليمات البرمجية المتفرعة والحساسة لزمن الانتقال.