Hypothesis test

Multi-Armed Bandit (UCB, Thompson Sampling)

Multi-armed bandit (MAB) er et adaptivt eksperimentelt rammeverk som sekvensielt allokerer forsøk til konkurrerende armer for å minimere kumulativt tap (regret) samtidig som man lærer hvilken arm som presterer best. Formalisert av Robbins i 1952 og med endelige garantier av Auer et al. (2002), balanserer det utforskning av usikre alternativer mot utnyttelse av for øyeblikket kjente beste alternativer — og overgår klassisk A/B-testing når tidlig avslutning eller kostnadssensitiv allokering er viktig.

Finn tema med PaperMindSnartVideoSnartLast ned lysbilder

Les hele metoden

Kun for medlemmer

Logg inn med en gratis konto for å lese denne delen.

Logg inn

Metodekart

Nabolaget av beslektede metoder — velg en node for å utforske.

Multi-Armed Bandit (UCB, Thompson Sampling)

A/B-test (Online kontrol…Adaptiv klinisk studiede…Randomisert kontrollert…Sekvensiell / gruppesekv…

Kilder

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

Slik siterer du denne siden

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/no/experimental-design/multiarm-bandit

Hvilken metode?

Sett denne metoden ved siden av sin nærmeste slektning og les dem side om side — biblioteket legger bøkene på bordet; valget er ditt.

A/B-test (Online kontrollert eksperiment)Forsøksdesign↔ sammenlign
Adaptiv klinisk studiedesignForsøksdesign↔ sammenlign
Randomisert kontrollert studie (RCT)Forsøksdesign↔ sammenlign
Sekvensiell / gruppesekvensiell studiedesignForsøksdesign↔ sammenlign

Sammenlign side om side →

Referert av

A/B-test (Online kontrollert eksperiment)

Funnet en feil på denne siden? Rapporter eller foreslå en rettelse →