Hypothesis test
المتعدد الأذرع (UCB، أخذ عينات طومسون)
تُعد مشكلة المتعدد الأذرع (MAB) إطارًا تجريبيًا تكيفيًا يخصص التجارب تتابعيًا عبر أذرع متنافسة لتقليل الندم التراكمي مع التعلم المتزامن لأي ذراع يقدم أفضل أداء. وقد صاغها روبنز في عام 1952، وقدم أور وآخرون (2002) ضمانات زمنية محدودة لها، وهي توازن بين استكشاف الخيارات غير المؤكدة واستغلال أفضل الخيارات المعروفة حاليًا - متفوقة على اختبار A/B الكلاسيكي كلما كان التوقف المبكر أو التخصيص الحساس للتكلفة مهمًا.
اقرأ الطريقة كاملة
للأعضاء فقط
تسجيل الدخولسجّل الدخول بحساب مجاني لقراءة هذا القسم.
خريطة المناهج
محيط المناهج ذات الصلة — اختر عقدةً للاستكشاف.
المصادر
- Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
- Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗
كيف تستشهد بهذه الصفحة
ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/ar/experimental-design/multiarm-bandit
أيُّ منهج؟
ضع هذا المنهج إلى جانب أقرب نظائره واقرأهما جنباً إلى جنب — المكتبة تضع الكتب على الطاولة، والاختيار لك.
- اختبار أ/ب (تجربة مضبوطة عبر الإنترنت)التصميم التجريبي↔ قارن
- تصميم التجربة السريرية التكيفيالتصميم التجريبي↔ قارن
- التجربة المعشاة ذات الشواهد (RCT)التصميم التجريبي↔ قارن
- تصميم التجارب المتسلسل / المتسلسل المجمعالتصميم التجريبي↔ قارن