Hypothesis test

Problem wielorękiego łobuza (UCB, Thompson Sampling)

Problem wielorękiego łobuza (MAB) to adaptacyjna struktura eksperymentalna, która sekwencyjnie alokuje próby pomiędzy konkurujące ramiona w celu minimalizacji skumulowanego żalu, jednocześnie ucząc się, które ramię działa najlepiej. Sformalizowany przez Robbinsa w 1952 roku i z gwarancjami skończonego czasu przez Auer et al. (2002), równoważy eksplorację niepewnych opcji z eksploatacją aktualnie znanych najlepszych opcji — przewyższając klasyczne testy A/B, gdy liczy się wczesne zakończenie lub alokacja wrażliwa na koszty.

Znajdź temat z PaperMindWkrótceWideoWkrótcePobierz slajdy

Przeczytaj pełny opis metody

Tylko dla członków

Zaloguj się na bezpłatne konto, aby przeczytać tę sekcję.

Zaloguj się

Mapa metod

Sąsiedztwo pokrewnych metod — wybierz węzeł, aby je zgłębić.

Problem wielorękiego łobuza (UCB, Thompson Sampling)

Test A/B (Eksperyment Ko…Adaptacyjny schemat bada…Randomizowane badanie ko…Projekt badania sekwency…

Źródła

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

Jak cytować tę stronę

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/pl/experimental-design/multiarm-bandit

Która metoda?

Zestaw tę metodę z najbliższymi jej krewnymi i czytaj je obok siebie — biblioteka kładzie księgi na stole; wybór należy do Ciebie.

Test A/B (Eksperyment Kontrolowany Online)Planowanie eksperymentów↔ porównaj
Adaptacyjny schemat badania klinicznegoPlanowanie eksperymentów↔ porównaj
Randomizowane badanie kontrolowane (RCT)Planowanie eksperymentów↔ porównaj
Projekt badania sekwencyjnego / grupowo-sekwencyjnegoPlanowanie eksperymentów↔ porównaj

Porównaj obok siebie →

Cytowana przez

Test A/B (Eksperyment Kontrolowany Online)

Widzisz błąd na tej stronie? Zgłoś go lub zaproponuj poprawkę →