ScholarGate
Avustaja
Hypothesis test

Monitoiden (UCB, Thompson Sampling) moniaseinen optimointi

Monitoiden (MAB) ongelma on adaptiivinen koejärjestely, joka kohdentaa yrityksiä peräkkäin kilpaileville haaroille kumulatiivisen katumuksen minimoimiseksi samalla kun opitaan, mikä haara suoriutuu parhaiten. Robbinsin (1952) formalisoima ja Auerin ym. (2002) antamien äärellisen ajan takuiden myötä se tasapainottaa epävarmojen vaihtoehtojen tutkimista tunnetusti parhaiden vaihtoehtojen hyödyntämistä vastaan – päihittäen klassisen A/B-testauksen aina, kun varhainen lopettaminen tai kustannustehokas kohdentaminen on tärkeää.

Etsi aihe työkalulla PaperMindTulossaVideoTulossaLataa diat

Lue koko menetelmä

Vain jäsenille

Kirjaudu sisään maksuttomalla tilillä lukeaksesi tämän osion.

Kirjaudu sisään

Menetelmäkartta

Lähimenetelmien naapurusto — valitse solmu tutkiaksesi.

Lähteet

  1. Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352
  2. Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070

Näin viittaat tähän sivuun

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/fi/experimental-design/multiarm-bandit

Mikä menetelmä?

Aseta tämä menetelmä lähimpien sukulaistensa rinnalle ja lue niitä yhdessä — kirjasto asettaa teokset pöydälle; valinta on sinun.

Vertaa rinnakkain

Tähän viittaavat

ScholarGateMulti-Armed Bandit (Multi-Armed Bandit (UCB, Thompson Sampling)). Haettu 2026-06-15 osoitteesta https://scholargate.app/fi/experimental-design/multiarm-bandit · Aineisto: https://doi.org/10.5281/zenodo.20539026