Hypothesis test

Многорукий бандит (UCB, Thompson Sampling)

Многорукий бандит (MAB) — это адаптивная экспериментальная структура, которая последовательно распределяет испытания между конкурирующими «руками» (вариантами) с целью минимизации совокупного сожаления при одновременном обучении тому, какая рука работает лучше. Формализованная Роббинсом в 1952 году и получившая гарантии для конечного времени от Auer et al. (2002), она балансирует исследование неопределенных вариантов с эксплуатацией в настоящее время известных лучших вариантов, превосходя классическое A/B-тестирование всякий раз, когда важна ранняя остановка или чувствительное к затратам распределение.

Найти тему в PaperMindСкороВидеоСкороСкачать слайды

Читать метод полностью

Только для участников

Войдите с бесплатным аккаунтом, чтобы прочитать этот раздел.

Войти

Карта метода

Окружение родственных методов — выберите узел, чтобы перейти к нему.

Многорукий бандит (UCB, Thompson Sampling)

A/B-тест (онлайн-контрол…Адаптивный дизайн клинич…Рандомизированное контро…Последовательный / групп…

Источники

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

Как цитировать эту страницу

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/ru/experimental-design/multiarm-bandit

Какой метод?

Поставьте этот метод рядом с ближайшими родственными и прочитайте их бок о бок — библиотека выкладывает книги на стол, а выбор за вами.

A/B-тест (онлайн-контролируемый эксперимент)Планирование эксперимента↔ сравнить
Адаптивный дизайн клинических исследованийПланирование эксперимента↔ сравнить
Рандомизированное контролируемое исследование (РКИ)Планирование эксперимента↔ сравнить
Последовательный / групповой последовательный дизайн испытанийПланирование эксперимента↔ сравнить

Сравнить рядом →

Упоминается в

A/B-тест (онлайн-контролируемый эксперимент)

Нашли ошибку на этой странице? Сообщите о ней или предложите исправление →