Hypothesis test

Bandido Multiarmado (UCB, Amostragem de Thompson)

O bandido multiarmado (MAB) é uma estrutura experimental adaptativa que aloca ensaios sequencialmente entre braços concorrentes para minimizar o arrependimento cumulativo, enquanto simultaneamente aprende qual braço tem o melhor desempenho. Formalizado por Robbins em 1952 e com garantias de tempo finito por Auer et al. (2002), ele equilibra a exploração de opções incertas com a exploração das melhores opções atualmente conhecidas — superando os testes A/B clássicos sempre que a interrupção precoce ou a alocação sensível ao custo são importantes.

Encontrar tema com PaperMindEm breveVídeoEm breveBaixar slides

Leia o método completo

Exclusivo para membros

Entre com uma conta gratuita para ler esta seção.

Entrar

Mapa de métodos

A vizinhança de métodos relacionados — selecione um nó para explorar.

Bandido Multiarmado (UCB, Amostragem de Thompson)

Teste A/B (Experimento C…Desenho Adaptativo de En…Ensaio Clínico Randomiza…Desenho de Ensaio Sequen…

Fontes

Auer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI: 10.1023/A:1013689704352 ↗
Russo, D., Van Roy, B., Kazerouni, A., Osband, I., & Wen, Z. (2018). A Tutorial on Thompson Sampling. Foundations and Trends in Machine Learning, 11(1), 1–96. DOI: 10.1561/2200000070 ↗

Como citar esta página

ScholarGate. (2026, June 1). Multi-Armed Bandit (UCB, Thompson Sampling). ScholarGate. https://scholargate.app/pt/experimental-design/multiarm-bandit

Qual método?

Coloque este método ao lado dos seus pares mais próximos e leia-os lado a lado — a biblioteca dispõe os livros sobre a mesa; a escolha é sua.

Teste A/B (Experimento Controlado Online)Delineamento experimental↔ comparar
Desenho Adaptativo de Ensaios ClínicosDelineamento experimental↔ comparar
Ensaio Clínico Randomizado (ECR)Delineamento experimental↔ comparar
Desenho de Ensaio Sequencial / Sequencial em GrupoDelineamento experimental↔ comparar

Comparar lado a lado →

Referenciado por

Teste A/B (Experimento Controlado Online)

Encontrou um problema nesta página? Relate ou sugira uma correção →