统计假设检验
假设检验是根据数据对总体竞争性陈述进行判定的理论,同时控制每种错误发生的概率。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
统计假设检验是一种规则,它利用样本数据来决定是拒绝零假设还是接受备择假设,其设计旨在使错误拒绝真实零假设的概率被选定的显著性水平所限制。
Scope
该领域涵盖了零假设和备择假设的制定、两类错误以及检验的功效和检验水平、用于简单假设最强检验的Neyman-Pearson引理、单调似然比和一致最强检验、无偏检验和不变检验、似然比检验及其大样本卡方分布、p值及其解释,以及同时检验多个假设的问题。
Sub-topics
Core questions
- 检验的功效和检验水平如何定义,两类错误之间如何权衡?
- 在两个简单假设之间进行决策时,哪种检验最强?
- 对于单侧备择假设,一致最强检验何时存在?
- 当同时检验多个假设时,应如何控制显著性?
Key theories
- Neyman-Pearson引理
- 在所有针对两个简单假设的给定检验水平的检验中,当似然比超过某个阈值时拒绝的似然比检验是最强的。
- 一致最强检验和无偏检验
- 对于具有单调似然比的族,单一检验对一侧的每个备择假设都是最强的;当不存在这样的检验时,则在无偏或不变类中寻求最优性。
- 似然比检验
- 广义似然比统计量比较零假设和完整模型下的最大似然;在正则条件下,其对数渐近服从卡方分布,从而提供了一种通用检验方法。
Clinical relevance
假设检验是临床试验评估、A/B测试、质量控制和信号检测的基础,其中控制假阳性率和确保足够的功效直接影响哪些干预措施、产品或发现被认为是真实的。
History
费舍尔在20世纪20年代发展了显著性检验和p值。Neyman和Pearson于1933年引入了包含两个假设、错误和功效的决策理论框架,而莱曼在世纪中叶的工作(后与Romano合作)则组织了检验的最优性理论。
Debates
- 费舍尔的显著性与Neyman-Pearson的决策
- 费舍尔将p值视为反对零假设的连续证据度量,而Neyman和Pearson则将检验构建为具有固定错误率的决策;这两种哲学在实践中常被融合,其差异仍存在争议。
Key figures
- Jerzy Neyman
- Egon Pearson
- Ronald A. Fisher
- Erich L. Lehmann
Related topics
Seminal works
- lehmannRomano2005
Frequently asked questions
- 第一类错误和第二类错误有什么区别?
- 第一类错误是拒绝了真实的零假设,即假阳性;第二类错误是未能拒绝错误的零假设,即假阴性。显著性水平限制了第一类错误的概率,而功效等于1减去第二类错误的概率。
- 小的p值能证明备择假设吗?
- 不能。小的p值表明在零假设下数据不太可能出现;它是反对零假设的证据,而不是零假设为假的概率,它本身并不能确立实际重要性。