ScholarGate
Trợ lý

So sánh phương pháp

Xem các phương pháp đã chọn cạnh nhau; những hàng khác biệt được làm nổi bật.

Thuật toán Multi-Armed Bandit (UCB, Thompson Sampling)×Thiết kế thử nghiệm tuần tự / nhóm tuần tự×
Lĩnh vựcThiết kế thí nghiệmThiết kế thí nghiệm
HọHypothesis testHypothesis test
Năm ra đời19521979
Người khởi xướngRobbins (1952); UCB1 by Auer et al. (2002); Thompson sampling by Thompson (1933)O'Brien & Fleming; Pocock; Lan & DeMets
LoạiSequential decision / bandit algorithmAdaptive stopping trial design
Công trình gốcAuer, P., Cesa-Bianchi, N., & Fischer, P. (2002). Finite-Time Analysis of the Multiarmed Bandit Problem. Machine Learning, 47(2–3), 235–256. DOI ↗O'Brien, P.C. & Fleming, T.R. (1979). A Multiple Testing Procedure for Clinical Trials. Biometrics, 35(3), 549–556. DOI ↗
Tên gọi khácMAB, bandit algorithm, UCB1, Thompson samplinggroup sequential design, adaptive stopping design, Ardışık Deneme Tasarımı (Sequential / Group Sequential)
Liên quan43
Tóm tắtThe multi-armed bandit (MAB) is an adaptive experimental framework that allocates trials sequentially across competing arms to minimise cumulative regret while simultaneously learning which arm performs best. Formalised by Robbins in 1952 and given finite-time guarantees by Auer et al. (2002), it balances exploration of uncertain options against exploitation of currently known best options — outperforming classical A/B testing whenever early stopping or cost-sensitive allocation matters.Sequential and group sequential trial designs allow a study to be stopped early — or continued — based on interim analyses conducted as data accumulate. The core framework was formalised by O'Brien and Fleming in 1979 and extended by Lan and DeMets's alpha-spending approach, and it controls the overall Type I error rate across all planned looks by pre-specifying both efficacy and futility boundaries before enrolment begins.
ScholarGateBộ dữ liệu
  1. v1
  2. 2 Nguồn tài liệu
  3. PUBLISHED
  1. v1
  2. 2 Nguồn tài liệu
  3. PUBLISHED

Đến trang tìm kiếm Tải xuống bản trình chiếu

ScholarGateSo sánh phương pháp: Multi-Armed Bandit · Sequential Design. Truy cập ngày 2026-06-17 từ https://scholargate.app/vi/compare