概率与概率分布
概率是量化不确定性的数学语言,而概率分布描述了随机变量可能值的分布情况。它们共同构成了卫生科学中统计推断的理论基础:每一个置信区间、p值和风险估计最终都依赖于数据可能如何产生的概率模型。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
概率将0到1之间的数字分配给事件,以表示其发生的可能性;概率分布是一个函数,它指定了随机变量可能值的概率。
Scope
本领域旨在向读者介绍概率的核心思想以及生物统计学中最常用的分布。它涵盖了概率的基本规则、条件概率和独立性、正态分布、用于计数和事件的二项分布和泊松分布,以及通过中心极限定理将样本与总体联系起来的抽样分布。这是一份关于方法学的参考教育性概述,而非临床指导。
Sub-topics
Core questions
- 如何量化不确定性以便对数据进行形式化推理?
- 什么分布描述了给定类型的测量或计数?
- 样本统计量的行为与基础总体有何关系?
- 为什么正态分布在聚合量中如此频繁地出现?
Key concepts
- 随机变量
- 样本空间和事件
- 概率公理
- 条件概率和独立性
- 离散分布和连续分布
- 期望和方差
- 抽样分布
- 中心极限定理
Mechanisms
概率模型指定了可能结果的样本空间,并根据公理(非负性、总概率为一、互斥事件的可加性)分配概率。随机变量将结果映射到数字,其分布总结了这些数字的概率,并通过均值(期望)和方差等量进行表征。离散分布(如二项分布和泊松分布)对事件计数进行建模;连续正态分布对许多测量量进行建模,并通过中心极限定理近似于和与平均值的分布。推断统计通过将观察到的统计量视为从其抽样分布中抽取的值来工作。
Clinical relevance
概率分布是用于总结健康数据和从研究中得出推论的统计方法的基础,因此理解它们有助于批判性地阅读定量文献。本条目描述了此类分析的方法学基础,并非个体诊断或治疗决策的依据。
History
数学概率起源于十七世纪对机会游戏的分析,并由伯努利、拉普拉斯、高斯和泊松发展成为一个通用的分布理论。科尔莫戈罗夫在20世纪30年代的公理化表述使概率奠定了严谨的基础。在整个二十世纪,这些工具成为统计推断的基础,生物统计学采纳它们来模拟医学和公共卫生研究中的测量和计数。
Key figures
- Pierre-Simon Laplace
- Carl Friedrich Gauss
- Siméon Denis Poisson
- Jacob Bernoulli
- Andrey Kolmogorov
Related topics
Seminal works
- altman-bland-1995-normal
- rosner-2015
- ross-2014
Frequently asked questions
- 为什么生物统计学课程在概率分布上花费如此多的时间?
- 因为统计推断通过将观察到的数据与概率模型预测的结果进行比较来工作;分布是样本与关于总体的陈述之间的桥梁,因此置信区间和检验的有效性取决于选择合适的分布。
- 概率和概率分布有什么区别?
- 概率是描述一个事件发生可能性的单个数字,而概率分布则一次性指定了随机变量所有可能值的概率。