Mchezo wa Mikono Mingi (UCB, Sampuli ya Thompson)
Mchezo wa mikono mingi (MAB) ni mfumo wa majaribio unaobadilika ambao hugawanya majaribio kwa mpangilio kwa mikono inayoshindana ili kupunguza hasara ya jumla huku ukijifunza kwa wakati mmoja ni mkono upi unaofanya kazi vizuri zaidi. Uliandaliwa rasmi na Robbins mnamo 1952 na kupewa dhamana za muda mfupi na Auer et al. (2002), unalinganisha uchunguzi wa chaguo zisizo na uhakika dhidi ya utumiaji wa chaguo bora zinazojulikana kwa sasa — ukizidi majaribio ya kawaida ya A/B wakati wowote kusimamisha mapema au ugawaji unaozingatia gharama unapohesabiwa.
Soma mbinu kamili
Ingia kwa akaunti ya bure ili kusoma sehemu hii.
Ramani ya mbinu
Jirani ya mbinu zinazohusiana — chagua nodi ili kuchunguza.
Vyanzo
- Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
- Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗
Jinsi ya kunukuu ukurasa huu
ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/sw/experimental-design/multiarm-bandit
Mbinu ipi?
Weka mbinu hii kando ya jamaa zake wa karibu na uzisome bega kwa bega — maktaba huweka vitabu mezani; uamuzi ni wako.
- Jaribio la A/B (Jaribio Lililodhibitiwa Mtandaoni)Muundo wa Majaribio↔ linganisha
- Muundo Unaobadilika wa Jaribio la KlinikiMuundo wa Majaribio↔ linganisha
- Jaribio Lililodhibitiwa kwa Nasibu (RCT)Muundo wa Majaribio↔ linganisha
- Muundo wa Majaribio Mfuatano / Mfuatano wa VikundiMuundo wa Majaribio↔ linganisha
Imerejelewa na
Umeona tatizo kwenye ukurasa huu? Ripoti au pendekeza marekebisho →