Monitoiden (UCB, Thompson Sampling) moniaseinen optimointi
Monitoiden (MAB) ongelma on adaptiivinen koejärjestely, joka kohdentaa yrityksiä peräkkäin kilpaileville haaroille kumulatiivisen katumuksen minimoimiseksi samalla kun opitaan, mikä haara suoriutuu parhaiten. Robbinsin (1952) formalisoima ja Auerin ym. (2002) antamien äärellisen ajan takuiden myötä se tasapainottaa epävarmojen vaihtoehtojen tutkimista tunnetusti parhaiden vaihtoehtojen hyödyntämistä vastaan – päihittäen klassisen A/B-testauksen aina, kun varhainen lopettaminen tai kustannustehokas kohdentaminen on tärkeää.
Lue koko menetelmä
Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.
Menetelmäkartta
Lähimenetelmien naapurusto — valitse solmu tutkiaksesi.
Lähteet
- Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
- Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗
Näin viittaat tähän sivuun
ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/fi/experimental-design/multiarm-bandit
Mikä menetelmä?
Aseta tämä menetelmä lähimpien sukulaistensa rinnalle ja lue niitä yhdessä — kirjasto asettaa teokset pöydälle; valinta on sinun.
- A/B-testaus (online-kontrolloitu koe)Koesuunnittelu↔ vertaa
- Adaptiivinen kliinisen tutkimuksen suunnitteluKoesuunnittelu↔ vertaa
- Satunnaistettu kontrolloitu tutkimus (RCT)Koesuunnittelu↔ vertaa
- Sekventiaalinen / ryhmäsekventiaalinen koeasetelmaKoesuunnittelu↔ vertaa
Tähän viittaavat
Huomasitko virheen tällä sivulla? Ilmoita siitä tai ehdota korjausta →