Hypothesis test

Multi-Armed Bandit (UCB, Thompson Sampling)

Multi-armed bandit (MAB) je adaptívny experimentálny rámec, ktorý sekvenčne prideľuje pokusy konkurenčným ramenám s cieľom minimalizovať kumulovanú stratu pri súčasnom učení sa, ktoré rameno funguje najlepšie. Formalizovaný Robbinsom v roku 1952 a s konečnými časovými zárukami od Auer et al. (2002), vyvažuje prieskum neistých možností oproti využívaniu momentálne známych najlepších možností — prekonáva klasické A/B testovanie vždy, keď je dôležité skoré zastavenie alebo alokácia citlivá na náklady.

Nájsť tému v PaperMindČoskoroVideoČoskoroStiahnuť snímky

Prečítať celú metódu

Len pre členov

Ak si chcete prečítať túto sekciu, prihláste sa s bezplatným účtom.

Prihlásiť sa

Mapa metód

Okolie príbuzných metód — vyberte uzol na preskúmanie.

Multi-Armed Bandit (UCB, Thompson Sampling)

A/B test (online riadený…Adaptívny dizajn klinick…Randomizovaný kontrolova…Sekvenčné / skupinové se…

Zdroje

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

Ako citovať túto stránku

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/sk/experimental-design/multiarm-bandit

Ktorá metóda?

Postavte túto metódu vedľa jej najbližších príbuzných a čítajte ich vedľa seba — knižnica vám knihy položí na stôl; voľba je na vás.

A/B test (online riadený experiment)Plánovanie experimentov↔ porovnať
Adaptívny dizajn klinických skúšaníPlánovanie experimentov↔ porovnať
Randomizovaný kontrolovaný pokus (RCT)Plánovanie experimentov↔ porovnať
Sekvenčné / skupinové sekvenčné návrhy skúšokPlánovanie experimentov↔ porovnať

Porovnať vedľa seba →

Odkazujú sem

A/B test (online riadený experiment)

Našli ste na tejto stránke chybu? Nahláste ju alebo navrhnite opravu →