ScholarGate
助手

自助法

自助法通过从观测数据中重复有放回抽样,并对每个重抽样数据重新计算统计量,来估计统计量的抽样分布。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

自助法是一种重抽样方法,通过从数据的经验分布中有放回地抽取许多样本,并重新计算估计量在这些样本上的分布,来近似估计量的抽样分布。

Scope

本主题涵盖了非参数自助法和插件原理、参数和光滑变体、置信区间的构建(百分位数、基本、偏差校正和加速、以及自助法-t)、自助法标准误差和偏差估计,以及对回归和相关数据(如块自助法)的调整。重点强调了其局限性和一致性条件。

Core questions

  • 从数据中有放回抽样如何近似真实的抽样分布?
  • 自助法标准误差和偏差估计是如何计算的?
  • 百分位数、自助法-t和偏差校正加速置信区间有何区别?
  • 自助法何时具有一致性,以及如何将其应用于回归和相关数据?

Key concepts

  • 有放回抽样
  • 经验分布
  • 自助法标准误差
  • 百分位数区间
  • 偏差校正和加速区间
  • 块自助法

Key theories

插件重抽样
用经验分布替代总体分布并从中进行重抽样,可以得到统计量抽样分布的蒙特卡洛近似,从而推导出标准误差和偏差。
自助法置信区间
自助法分布的分位数给出百分位数区间;偏差校正和加速以及自助法-t区间等改进方法通过校正估计量分布中的偏差和偏度来提高覆盖率。

Clinical relevance

自助法为没有封闭形式方差的估计量(如中位数、相关系数和复杂模型输出)提供了标准误差和置信区间,并常用于量化生物统计学、计量经济学和机器学习中的不确定性。

History

Efron于1979年引入自助法,作为刀切法(jackknife)的推广;随后的工作发展了更精确的置信区间,建立了其一致性理论,并产生了适用于回归、时间序列和其他相关数据环境的变体。

Debates

自助法何时失效
对于受极端值影响的统计量、处于参数空间边界的参数以及在强相关性下,普通的非参数自助法可能不一致,因此需要进行校正,例如m-out-of-n自助法和子抽样。

Key figures

  • Bradley Efron
  • Robert Tibshirani
  • Anthony Davison
  • David Hinkley

Related topics

Seminal works

  • efron1979
  • efron1993

Frequently asked questions

为什么要进行有放回抽样?
有放回抽样允许每个重抽样与原始样本不同,同时保持相同的样本量,这模拟了从总体中抽取新样本的变异性。如果没有放回抽样,每个重抽样都只是原始数据重新排序而已。
需要多少次自助法重抽样?
对于标准误差,几百次就足够了,但基于尾部量分位数的置信区间通常需要几千次或更多,以便稳定地估计极端分位数。

Methods for this concept

Related concepts