点估计与区间估计
点估计和区间估计是总结样本信息以推断未知总体数量的两种基本方法。点估计是一个单一的最佳猜测值——例如,样本均值作为真实均值的估计值——而区间估计则围绕该猜测值提供一个可能包含真实数量的范围。同时报告点估计和区间估计不仅能传达效应的大小,还能说明其测量的精确程度。
Definition
点估计是根据样本数据计算出的一个单一值,用于近似未知的总体参数;区间估计是根据相同数据和既定方法得出的一个值范围,旨在以特定置信水平包含该参数。
Scope
本主题涵盖了优秀点估计量的特点(例如无偏性和有效性)、标准误差如何量化估计的精确度,以及如何将点估计扩展为区间估计。它将估计视为设计和评估研究的参考方法,而非临床规则。
Core questions
- 感兴趣的总体数量的最佳单一估计是什么?
- 该估计的精确度如何——在重复抽样中它会有多大变化?
- 什么范围的值与数据合理地一致?
- 哪些特性使得一个估计量优于另一个?
Key concepts
- 估计量与估计值
- 总体参数
- 无偏性
- 效率与精确度
- 标准误差
- 抽样分布
- 误差幅度
- 最大似然估计
Mechanisms
点估计量是将样本数据映射到近似参数的数字的规则;样本均值、样本比例和回归系数是常见的例子。由于不同的样本会给出不同的值,每个点估计都有一个抽样分布,其离散程度由标准误差概括——标准误差越小意味着估计越精确。区间估计通过将点估计与其标准误差的倍数相结合(或者,对于有界数量如比例,使用Clopper-Pearson构造等精确方法)来构建。好的估计量通常根据偏差、效率和一致性来判断,以便随着样本量的增加,估计值集中于真实值。
Clinical relevance
健康研究中报告的效应量——均值差异、相对风险、患病率数据——都是点估计,其伴随的区间告诉读者这些估计的可靠程度。认识到没有精确度量度的点估计是不完整的,是一项核心评估技能。本条目解释了这些估计是如何形成的,并非个体临床决策的依据。
Evidence & guidelines
健康科学领域的方法学指南长期以来一直敦促作者在呈现效应估计时同时报告其精确度,而不是仅仅依赖显著性判断。Gardner和Altman关于区间报告的有影响力的论点,以及Greenland及其同事后来对误解的指导,构成了目前医学期刊所期望的惯例。
History
点估计在20世纪20年代通过费舍尔关于最大似然法的工作奠定了严格的基础,而区间估计也同期发展起来,包括1934年Clopper-Pearson二项式比例限值等精确区间构造。在20世纪后期,医学领域常规报告带有区间的估计的重点得到了巩固。
Key figures
- Ronald A. Fisher
- Jerzy Neyman
- Egon Pearson
- Douglas G. Altman
Related topics
Seminal works
- gardner-altman-1986
- clopper-pearson-1934
Frequently asked questions
- 点估计和区间估计有什么区别?
- 点估计是一个单一的数字,例如样本均值,用作未知数量的最佳猜测;区间估计是围绕该数字的一个范围,传达了该数量被测量的精确程度。
- 标准误差衡量什么?
- 它衡量的是估计值在假设的重复样本中的变异性——实际上是估计的精确度。标准误差越小,意味着点估计由数据确定的越紧密。