I型错误和II型错误有什么区别？

I型错误是假阳性——当没有效应时却得出有效应的结论——而II型错误是假阴性——未能发现真实存在的效应。它们的概率分别称为alpha和beta。

为什么我不能让两种错误率都尽可能小？

在样本量固定的情况下，两者之间存在权衡：收紧检验以减少假阳性会增加假阴性。同时减少两者的主要方法是扩大样本量。

I型和II型错误

I型和II型错误是假设检验得出错误结论的两种方式。I型错误是假阳性——拒绝一个真实的零假设，并声称存在一个实际上不存在的效应——而II型错误是假阴性——未能检测到一个真实存在的效应。显著性水平控制着I型错误的发生率，而II型错误率的补数是统计功效，因此这两种错误类型构成了研究设计中如何平衡过度主张和不足主张风险的框架。

用 PaperMind 寻找选题即将推出Find papers & topics

Tools & resources

下载幻灯片

Learn & explore

视频即将推出

Definition

I型错误是指拒绝一个实际上为真的零假设（假阳性），其发生概率为alpha；II型错误是指未能拒绝一个实际上为假的零假设（假阴性），其发生概率为beta。

Scope

本主题定义了这两种错误类型，将它们与显著性水平（alpha）和II型错误率（beta）联系起来，并解释了它们在研究设计中的权衡。它是一种评估和规划研究的参考方法论，而非临床决策规则。

Core questions

得出假阳性结论与假阴性结论意味着什么？
显著性水平和II型错误率与这些错误有何关系？
为什么降低一种错误率会提高另一种错误率？
样本量如何影响每种错误的发生概率？

Key concepts

I型错误（假阳性）
II型错误（假阴性）
显著性水平（alpha）
II型错误率（beta）
功效（1减去beta）
错误权衡
多重检验与假阳性膨胀

Mechanisms

在Neyman-Pearson方案中，通过预先设定可容忍的I型错误率（alpha，即显著性水平）来设计检验，这决定了真实的零假设被错误拒绝的频率。II型错误率（beta）是错过给定大小的真实效应的概率，而1减去beta是检验的功效。在样本量固定的情况下，两种错误率之间存在权衡：使检验更严格以减少假阳性会增加假阴性的可能性，反之亦然。增加样本量是同时减少这两种错误的主要方法。未经调整地检验多个假设会夸大总体I型错误率，这就是多重性成为一个常见设计问题的原因。

Clinical relevance

这些错误类型是试验和观察性研究结论可能产生误导的基础：假阳性结果可能推广一种无效的干预措施，而假阴性结果可能否定一种有用的干预措施。阅读研究是否控制了其错误率——以及无效结果是否仅仅反映了低功效——是证据评估的核心。本条目解释了推断错误，并非个体临床决策的依据。

Evidence & guidelines

方法学评论强调，非显著性结果并非没有效应的证据，因为功效不足的研究容易犯II型错误；Altman和Bland的“缺乏证据并非没有证据”的观点直接抓住了这一点。对功效不足研究的综述，例如Button及其同事在神经科学领域的分析，记录了低功效如何既夸大假阴性又降低显著性发现的可靠性。

History

第一类和第二类错误之间的区别是由Neyman和Pearson在他们1933年对假设检验的形式化中引入的，该形式化将检验设计定义为对这两种错误概率的控制。实际后果——特别是小型研究中II型错误的危险——成为20世纪和21世纪对健康和行为研究方法学批判中反复出现的主题。

Debates

非显著性结果的解释: 由于功效不足的研究经常犯II型错误，非显著性发现常被误读为证明没有效应；方法学家强调，缺乏证据并非没有证据。

Key figures

Jerzy Neyman
Egon Pearson
Douglas G. Altman
J. Martin Bland
John P. A. Ioannidis

Seminal works

neyman-pearson-1933
altman-bland-1995

Frequently asked questions

I型错误和II型错误有什么区别？: I型错误是假阳性——当没有效应时却得出有效应的结论——而II型错误是假阴性——未能发现真实存在的效应。它们的概率分别称为alpha和beta。
为什么我不能让两种错误率都尽可能小？: 在样本量固定的情况下，两者之间存在权衡：收紧检验以减少假阳性会增加假阴性。同时减少两者的主要方法是扩大样本量。