ScholarGate
Msaidizi
Hypothesis test

Mchezo wa Mikono Mingi (UCB, Sampuli ya Thompson)

Mchezo wa mikono mingi (MAB) ni mfumo wa majaribio unaobadilika ambao hugawanya majaribio kwa mpangilio kwa mikono inayoshindana ili kupunguza hasara ya jumla huku ukijifunza kwa wakati mmoja ni mkono upi unaofanya kazi vizuri zaidi. Uliandaliwa rasmi na Robbins mnamo 1952 na kupewa dhamana za muda mfupi na Auer et al. (2002), unalinganisha uchunguzi wa chaguo zisizo na uhakika dhidi ya utumiaji wa chaguo bora zinazojulikana kwa sasa — ukizidi majaribio ya kawaida ya A/B wakati wowote kusimamisha mapema au ugawaji unaozingatia gharama unapohesabiwa.

Tafuta mada kwa PaperMindHivi karibuniVideoHivi karibuniPakua slaidi

Soma mbinu kamili

Kwa wanachama pekee

Ingia kwa akaunti ya bure ili kusoma sehemu hii.

Ingia

Ramani ya mbinu

Jirani ya mbinu zinazohusiana — chagua nodi ili kuchunguza.

Vyanzo

  1. Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352
  2. Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070

Jinsi ya kunukuu ukurasa huu

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/sw/experimental-design/multiarm-bandit

Mbinu ipi?

Weka mbinu hii kando ya jamaa zake wa karibu na uzisome bega kwa bega — maktaba huweka vitabu mezani; uamuzi ni wako.

Linganisha bega kwa bega

Imerejelewa na

ScholarGateMulti-Armed Bandit (Multi-Armed Bandit (UCB, Thompson Sampling)). Imepatikana 2026-06-15 kutoka https://scholargate.app/sw/experimental-design/multiarm-bandit · Seti ya data: https://doi.org/10.5281/zenodo.20539026