Hypothesis test

Многорък бандит (UCB, семплиране на Томпсън)

Многоръкият бандит (MAB) е адаптивна експериментална рамка, която разпределя последователно опити между конкуриращи се „ръце“, за да минимизира кумулативния регрет, като същевременно научава коя „ръка“ се представя най-добре. Формализиран от Робинс през 1952 г. и с гаранции за крайно време от Ауер и др. (2002), той балансира изследването на несигурни опции срещу експлоатацията на текущо известни най-добри опции – надминавайки класическото A/B тестване, когато ранното спиране или чувствителното към разходите разпределение са от значение.

Намерете тема с PaperMindСкороВидеоСкороИзтегляне на слайдове

Прочетете целия метод

Само за членове

Влезте с безплатен профил, за да прочетете този раздел.

Вход

Карта на методите

Обкръжението на сродните методи — изберете възел, за да го разгледате.

Многорък бандит (UCB, семплиране на Томпсън)

A/B тест (онлайн контрол…Адаптивен дизайн на клин…Рандомизирано контролира…Последователен / Групов…

Източници

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

Как да цитирате тази страница

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/bg/experimental-design/multiarm-bandit

Кой метод?

Поставете този метод до най-близките му сродни методи и ги четете едно до друго — библиотеката полага книгите на масата; изборът е ваш.

A/B тест (онлайн контролиран експеримент)Планиране на експеримента↔ сравняване
Адаптивен дизайн на клинични изпитванияПланиране на експеримента↔ сравняване
Рандомизирано контролирано проучване (РКП)Планиране на експеримента↔ сравняване
Последователен / Групов последователен дизайн на изпитванияПланиране на експеримента↔ сравняване

Сравняване едно до друго →

Цитиран в

A/B тест (онлайн контролиран експеримент)

Забелязахте ли проблем на тази страница? Съобщете или предложете поправка →