自助法与重抽样
自助法通过重抽样观测数据来估计统计量的抽样分布,用计算取代了难以处理的公式。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
自助法是一种重抽样方法,它通过将观测样本视为总体并从中重复抽取样本(通常有放回),来近似统计量的抽样分布,以估计标准误差、置信区间和偏差。
Scope
本主题涵盖了通过有放回重抽样的非参数自助法、参数自助法、刀切法及其偏差和方差估计、置换检验、自助法标准误差以及百分位数、偏差校正和自助法-t置信区间、自助法的一致性及其通过Edgeworth展开实现的高阶精度,以及普通自助法失效的已知案例,例如样本最大值。
Core questions
- 数据重抽样如何近似统计量的抽样分布?
- 自助法置信区间是如何构建的,百分位数区间和自助法-t区间有何不同?
- 自助法何时具有一致性,何时会失效?
- 置换检验如何利用重抽样获得精确的无分布检验?
Key theories
- 自助法原理
- 通过经验分布近似未知总体并从中重抽样,即使没有封闭形式的分布,也可以通过模拟估计几乎任何统计量的抽样变异性。
- 自助法的一致性和精度
- 对于平滑统计量,自助法是一致的,并且通过Edgeworth展开,某些自助法区间比正态近似更精确;对于非平滑泛函(如最大值),它可能会失效。
Clinical relevance
自助法为复杂估计量(如中位数、相关性和机器学习预测)提供了标准误差和置信区间,而这些估计量通常没有解析公式;置换检验则提供了精确的显著性评估,广泛应用于基因组学和随机实验中。
History
Quenouille和Tukey在1950年代开发了刀切法。Efron于1979年引入了自助法,统一并扩展了这些重抽样思想;Hall在1980年代和1990年代的工作通过Edgeworth展开确立了其高阶精度。
Key figures
- Bradley Efron
- Robert Tibshirani
- Peter Hall
- Maurice Quenouille
Related topics
Seminal works
- efron1979
Frequently asked questions
- 自助法是否凭空创造了新信息?
- 不是。它重用了样本中已有的信息来近似抽样变异性;它不能改善不良或有偏的样本,其精度取决于原始样本能否很好地代表总体。
- 自助法何时会失效?
- 对于非平滑依赖于分布的统计量,例如样本最大值或边界上的参数,它可能会失效;在这种情况下,通常会使用子抽样或m-out-of-n自助法等修改方案。