Hypothesis test

المتعدد الأذرع (UCB، أخذ عينات طومسون)

تُعد مشكلة المتعدد الأذرع (MAB) إطارًا تجريبيًا تكيفيًا يخصص التجارب تتابعيًا عبر أذرع متنافسة لتقليل الندم التراكمي مع التعلم المتزامن لأي ذراع يقدم أفضل أداء. وقد صاغها روبنز في عام 1952، وقدم أور وآخرون (2002) ضمانات زمنية محدودة لها، وهي توازن بين استكشاف الخيارات غير المؤكدة واستغلال أفضل الخيارات المعروفة حاليًا - متفوقة على اختبار A/B الكلاسيكي كلما كان التوقف المبكر أو التخصيص الحساس للتكلفة مهمًا.

اعثر على موضوع باستخدام PaperMindقريبًافيديوقريبًاتنزيل الشرائح

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

خريطة المناهج

محيط المناهج ذات الصلة — اختر عقدةً للاستكشاف.

المتعدد الأذرع (UCB، أخذ عينات طومسون)

اختبار أ/ب (تجربة مضبوطة…تصميم التجربة السريرية ا…التجربة المعشاة ذات الشو…تصميم التجارب المتسلسل /…

المصادر

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/ar/experimental-design/multiarm-bandit

أيُّ منهج؟

ضع هذا المنهج إلى جانب أقرب نظائره واقرأهما جنباً إلى جنب — المكتبة تضع الكتب على الطاولة، والاختيار لك.

اختبار أ/ب (تجربة مضبوطة عبر الإنترنت)التصميم التجريبي↔ قارن
تصميم التجربة السريرية التكيفيالتصميم التجريبي↔ قارن
التجربة المعشاة ذات الشواهد (RCT)التصميم التجريبي↔ قارن
تصميم التجارب المتسلسل / المتسلسل المجمعالتصميم التجريبي↔ قارن

قارن جنباً إلى جنب →

يُستشهد بها في

اختبار أ/ب (تجربة مضبوطة عبر الإنترنت)

هل لاحظت مشكلة في هذه الصفحة؟ أبلغ عنها أو اقترح تصحيحًا →