Hypothesis test

Problém víceocasého bandity (UCB, Thompson Sampling)

Problém víceocasého bandity (MAB) je adaptivní experimentální rámec, který sekvenčně alokuje pokusy mezi konkurenční „ocas“ (varianty, léčby, položky) s cílem minimalizovat kumulativní lítost (regret) a současně se učit, který „ocas“ funguje nejlépe. Formalizován Robbinsnem v roce 1952 a s konečnými časovými zárukami od Auer et al. (2002) vyvažuje průzkum (exploration) nejistých možností proti využití (exploitation) aktuálně známých nejlepších možností — překonává klasické A/B testování, kdykoli je důležité včasné zastavení nebo alokace citlivá na náklady.

Najít téma v PaperMindJiž brzyVideoJiž brzyDownload slides

Přečíst celou metodu

Pouze pro členy

Pro přečtení této sekce se přihlaste s bezplatným účtem.

Přihlásit se

Method map

The neighbourhood of related methods — select a node to explore.

Problém víceocasého bandity (UCB, Thompson Sampling)

A/B test (online řízený…Adaptivní návrh klinické…Randomizovaný kontrolova…Sekvenční / skupinový se…

Zdroje

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

Jak citovat tuto stránku

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/cs/experimental-design/multiarm-bandit

Which method?

Set this method beside its closest kin and read them side by side — the library lays the books on the table; the choice is yours.

A/B test (online řízený experiment)Plánování experimentů↔ compare
Adaptivní návrh klinického hodnoceníPlánování experimentů↔ compare
Randomizovaný kontrolovaný proces (RCT)Plánování experimentů↔ compare
Sekvenční / skupinový sekvenční design studiePlánování experimentů↔ compare

Compare side by side →

Odkazuje sem

A/B test (online řízený experiment)

Našli jste na této stránce chybu? Nahlaste ji nebo navrhněte opravu →