重抽样方法
重抽样方法通过从观测数据中重复抽取新样本来评估统计量的不确定性,用计算代替了标准误差和分布的解析公式。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
重抽样方法是计算密集型推断技术,通过对从观测数据中抽取或分割的样本重复计算统计量,来估计其抽样分布、偏差、方差或预测误差。
Scope
该领域涵盖了自助法(bootstrap)及其置信区间、用于偏差和方差估计的刀切法(jackknife)、用于假设检验的置换检验和随机化检验,以及用于估计预测误差的交叉验证。其统一思想是,通过重抽样重复使用的经验数据分布,可以替代未知的总体分布。
Sub-topics
Core questions
- 重复重抽样观测数据如何近似统计量的抽样分布?
- 自助法、刀切法、置换检验和交叉验证在目的和机制上有何区别?
- 重抽样近似何时成功,何时失效?
- 重抽样方法如何在没有参数假设的情况下用于构建置信区间和检验?
Key theories
- 即插即用原则
- 重抽样用样本的经验分布代替未知的总体分布,因此标准误差和偏差等量通过从数据本身重复抽样来计算。
- 用于推断的重抽样
- 自助法重抽样估计变异性和置信区间,置换重抽样生成精确或近似的零分布,交叉验证重用数据分区以估计样本外误差。
Clinical relevance
重抽样方法为不存在易处理公式的复杂统计量提供了标准误差、置信区间和检验,并为统计和机器学习模型提供了预测准确性的真实估计;其最小的假设使其在实证科学中无处不在。
History
Quenouille 和 Tukey 在 20 世纪 40 年代和 50 年代开发了刀切法;Efron 于 1979 年引入了自助法,并将其与刀切法统一起来。20 世纪 80 年代和 90 年代廉价计算的兴起使重抽样成为渐近理论的主流替代方法。
Key figures
- Bradley Efron
- Robert Tibshirani
- Anthony Davison
- Maurice Quenouille
Related topics
Seminal works
- efron1993
- efron1979
Frequently asked questions
- 为什么重抽样方法被称为计算密集型?
- 它们用对重抽样数据上统计量的数千次重复计算代替了封闭形式的推导。这只有通过计算机才能实现,但作为交换,这些方法所需的建模假设要少得多。
- 重抽样方法总是有效吗?
- 不。对于依赖于极端顺序统计量的统计量、非常小的样本或在强依赖性下,它们可能会失效。了解这些失效模式是负责任地使用这些方法的一部分。