ScholarGate
助手

变异性度量

变异性度量,或称离散度度量,量化了一组观测值围绕其中心散布的程度。两个数据集可以具有相同的均值,但在其值聚集的紧密程度上可能存在很大差异,而诸如极差、方差、标准差和四分位距等度量则捕捉了这种差异。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

变异性度量量化了观测值围绕中心值的散布程度:极差是最大值和最小值之间的差,方差是观测值与均值之间偏差的平方的平均值,标准差是方差的平方根,单位与原始数据相同,而四分位距是有序数据中间一半的散布范围。

Scope

本条目涵盖了主要的离散度度量——极差、方差、标准差和四分位距——以及它们的计算和解释方法。它区分了标准差和标准误,并且是一个方法学参考,而非临床指导。

Core questions

  • 观测值围绕其中心的散布范围有多广?
  • 哪种离散度度量与所选的集中趋势度量适当配对?
  • 标准差与标准误有何不同?

Key concepts

  • 极差
  • 方差
  • 标准差
  • 四分位距
  • 变异系数
  • 标准差与标准误
  • 离散度与集中趋势的配对

Mechanisms

极差,即极端值之间的差距,简单但不稳定,因为它仅依赖于两个值,并且随样本量的增加而增大。方差计算观测值与均值之间偏差的平方的平均值,而标准差将该量返回到原始测量单位,使其成为近似对称数据的均值的天然伴侣。四分位距,涵盖第25百分位数到第75百分位数,描述了数据中间一半的分布,并且对异常值具有鲁棒性,使其成为偏态分布中位数的伴侣。一个常见的混淆来源是标准差(描述个体观测值的散布)与标准误(描述均值等估计量的精确度,并随样本量增大而减小)之间的区别。

Clinical relevance

离散度度量告诉读者测量或结果的变异程度,这对于判断一致性、参考范围和报告估计值的精确度至关重要。本条目描述了如何总结变异性以进行评估,而不是作为个体诊断或治疗决策的基础。

Epidemiology

在健康研究中,报告变异性以及集中趋势是基本要求,而标准差与标准误的区别是一个常见的报告错误:混淆它们可能会使估计值看起来比实际更精确或更不精确。当数据偏斜时,首选四分位距。

History

方差和标准差在19世纪末和20世纪初被正式化,其中“标准差”一词由卡尔·皮尔逊引入,方差的分析框架由罗纳德·费舍尔发展。在20世纪探索性数据分析和箱线图兴起之后,基于分位数的稳健四分位距获得了突出地位。

Debates

报告中应使用标准差还是标准误?
作者经常报告标准误而不是标准差,因为它在数值上更小,这可能会误导读者对基础观测值变异性的判断;方法学指南强调报告标准差以描述散布,并将标准误保留用于估计值的精确度。

Key figures

  • Douglas G. Altman
  • J. Martin Bland
  • S. Manikandan

Related topics

Seminal works

  • manikandan-2011-dispersion
  • altman-bland-2005

Frequently asked questions

标准差和标准误有什么区别?
标准差描述了个体观测值围绕均值的变异程度,而标准误描述了均值本身估计的精确程度。标准误随样本量的增加而减小;标准差则不会。
何时应使用四分位距而不是标准差?
当数据偏斜或包含异常值时,四分位距能更真实地描述散布,因为它像中位数一样不受极端值的影响。

Methods for this concept

Related concepts