ScholarGate
助手

描述性统计

描述性统计是用于总结和呈现数据集特征而不对其进行超出范围泛化的方法。它们将一系列观测值浓缩为几个可解释的数字和图表,描述数据的中心位置、变异程度以及分布形状。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

描述性统计是数值和图形摘要,用于表征现有数据的集中趋势、变异性和分布,描述样本本身,而不是推断更大总体的属性。

Scope

本条目涵盖描述性统计的定义、其与推断性统计的区别,以及描述性测量的主要类别:分类数据的计数和比例,以及数值数据的位置和离散度。它是一个方法学参考,不提供临床指导。

Core questions

  • 正在总结哪种类型的变量,以及哪种描述性测量适合它?
  • 数据的中心在哪里,以及它们分布的范围有多广?
  • 分类变量与连续变量相比应如何总结?

Key concepts

  • 描述性统计与推断性统计
  • 分类数据的频率、计数和比例
  • 集中趋势测量
  • 离散度测量
  • 表格和图形摘要
  • 测量水平(名义、序数、区间、比率)

Mechanisms

描述性分析首先根据测量水平对每个变量进行分类。分类变量通过计数、比例和频率表进行总结;数值变量通过集中趋势测量与离散度测量相结合进行总结,选择依据是分布的形状——对于大致对称的数据,使用均值和标准差;对于偏态数据,使用中位数和四分位距。这些数值摘要通常伴随着图形显示,以便数字无法传达的分布特征变得可见。

Clinical relevance

描述性统计数据几乎存在于所有临床研究的基线特征表和结果部分,因此理解它们对于阅读医学文献至关重要。本条目描述了如何总结数据以供评估,而不是作为个体诊断或治疗决策的基础。

Epidemiology

在流行病学和临床研究中,描述性统计是第一个分析产出,用于在估计任何关联或效应之前表征研究样本、暴露和结局。透明地报告描述性测量是研究报告标准的基本要求。

History

描述性总结早于正式的统计推断,起源于人口统计和精算记录。20世纪在概念上将统计的描述性和推断性角色分开,约翰·图基(John Tukey)的探索性数据分析项目后来重新强调了描述和视觉总结作为分析的一个独特而重要阶段。

Key figures

  • John W. Tukey
  • Douglas G. Altman

Related topics

Seminal works

  • tukey-1977
  • gupta-2019

Frequently asked questions

描述性统计与推断性统计有何不同?
描述性统计总结所收集的数据;推断性统计利用这些数据对更广泛的总体做出概率性陈述。描述性测量不超出观测样本做出任何断言。
连续变量应报告哪些描述性测量?
一个集中趋势测量与一个离散度测量相结合,选择与分布相匹配:当数据近似对称时使用均值和标准差,当数据偏斜时使用中位数和四分位距。

Methods for this concept

Related concepts