ScholarGate
المساعد
Hypothesis test

المتعدد الأذرع (UCB، أخذ عينات طومسون)

تُعد مشكلة المتعدد الأذرع (MAB) إطارًا تجريبيًا تكيفيًا يخصص التجارب تتابعيًا عبر أذرع متنافسة لتقليل الندم التراكمي مع التعلم المتزامن لأي ذراع يقدم أفضل أداء. وقد صاغها روبنز في عام 1952، وقدم أور وآخرون (2002) ضمانات زمنية محدودة لها، وهي توازن بين استكشاف الخيارات غير المؤكدة واستغلال أفضل الخيارات المعروفة حاليًا - متفوقة على اختبار A/B الكلاسيكي كلما كان التوقف المبكر أو التخصيص الحساس للتكلفة مهمًا.

اعثر على موضوع باستخدام PaperMindقريبًافيديوقريبًاتنزيل الشرائح

اقرأ الطريقة كاملة

للأعضاء فقط

سجّل الدخول بحساب مجاني لقراءة هذا القسم.

تسجيل الدخول

خريطة المناهج

محيط المناهج ذات الصلة — اختر عقدةً للاستكشاف.

المصادر

  1. Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352
  2. Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070

كيف تستشهد بهذه الصفحة

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/ar/experimental-design/multiarm-bandit

أيُّ منهج؟

ضع هذا المنهج إلى جانب أقرب نظائره واقرأهما جنباً إلى جنب — المكتبة تضع الكتب على الطاولة، والاختيار لك.

قارن جنباً إلى جنب

يُستشهد بها في

ScholarGateMulti-Armed Bandit (Multi-Armed Bandit (UCB, Thompson Sampling)). استُرجع بتاريخ 2026-06-15 من https://scholargate.app/ar/experimental-design/multiarm-bandit · مجموعة البيانات: https://doi.org/10.5281/zenodo.20539026