ScholarGate
助手

集中趋势度量

集中趋势度量是单一数值,用于概括数据集的主体所在位置——即其他观测值围绕其聚集的典型或中心观测值。三种经典的度量是均值、中位数和众数,选择哪种取决于测量水平和分布的形状。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

集中趋势度量是识别分布中心的单一数值:算术均值是数值之和除以其数量,中位数是观测值排序后的中间值,众数是出现频率最高的数值。

Scope

本条目涵盖均值、中位数和众数:如何计算它们,它们代表什么,以及何时它们是合适的中心位置总结。这是一份方法学参考资料,不提供临床指导。

Core questions

  • 哪种位置度量最能代表这个变量?
  • 分布形状如何影响均值和中位数之间的选择?
  • 众数何时是最具信息量的总结?

Key concepts

  • 算术均值
  • 中位数
  • 众数
  • 对异常值的稳健性
  • 偏度对均值和中位数的影响
  • 测量水平和平均值的选择

Mechanisms

均值使用每个观测值,是对称、区间或比率尺度数据的自然总结,但正因为它包含了所有值,它会被极端观测值拉动,并受到偏度和异常值的扭曲。中位数是排序数据中的中间值,它忽略了极端值的大小,因此具有稳健性,使其成为偏态连续数据和有序变量的首选总结。众数是最常见的值,是唯一适用于名义数据的度量,对于识别最典型的类别或分布中的峰值很有用。在完美对称的单峰分布中,三者重合;随着偏度增加,均值在尾部方向上偏离最远。

Clinical relevance

报告的平均值——平均血压、中位生存期、最常见的诊断——是临床发现沟通的核心,识别使用了哪种度量可以防止误读偏态数据。本条目描述了如何总结位置以进行评估,而不是作为个体诊断或治疗决策的基础。

Epidemiology

由于许多健康测量值呈偏态分布,中位数通常是典型值更忠实的总结,而报告此类数据的均值可能会高估中心值。因此,度量的选择会影响人口特征和结果的传达方式。

History

算术均值自古以来就被用于组合测量,而均值、中位数和众数之间的正式区分随着19世纪和20世纪早期描述性统计学的成熟而巩固。中位数能更好地代表偏态分布的认识是一个长期存在的原则,在应用统计文献中反复强调。

Debates

偏态临床数据应使用均值还是中位数?
对于医学中常见的右偏量——成本、住院时间、生物标志物水平——均值会被尾部夸大,而中位数则追踪典型值,因此指南通常倾向于中位数,均值保留给大致对称的数据。

Key figures

  • S. Manikandan

Related topics

Seminal works

  • manikandan-2011-mean
  • manikandan-2011-median-mode

Frequently asked questions

何时应报告中位数而不是均值?
当分布偏斜或包含异常值时,或者当变量为有序变量时。在这些情况下,中位数比被极端值拉动的均值更能忠实地代表典型值。
众数可以用于任何类型的数据吗?
是的。众数是唯一适用于名义(分类)数据的集中趋势度量,它也可以突出数值数据中的峰值或最常见值。

Methods for this concept

Related concepts