后验预测检验
后验预测检验通过将观测数据与从拟合模型模拟的数据进行比较,评估模型的绝对拟合度。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
后验预测检验从拟合模型的后验预测分布中生成重复数据,并将这些重复数据的特征与观测数据的相同特征进行比较,将系统性差异标记为模型不拟合的证据。
Scope
本主题涵盖从后验预测分布中模拟重复数据集、检验量和差异度量(discrepancy measures)的使用、图形检验以及后验预测p值,并将其解释为一种自洽性检验而非假设检验。
Core questions
- 如何从后验预测分布中抽取重复数据集?
- 什么是检验量和差异度量,以及如何选择它们?
- 如何计算和解释后验预测p值?
- 为什么后验预测检验是拟合度检验而不是模型选择规则?
Key concepts
- 后验预测分布
- 重复数据
- 检验量
- 差异度量
- 后验预测p值
- 图形模型检验
Key theories
- 重复数据比较
- 如果模型拟合良好,则从中模拟的数据应在相关方面与观测数据相似;所选检验量中的系统性差异揭示了模型失败之处。
- 后验预测p值
- 后验预测p值是重复数据的差异度量超过观测数据的差异度量的概率;它是一种图形和诊断工具,具有保守性,并非校准的频率论检验。
Clinical relevance
后验预测检验使分析人员能够在报告结论之前检测到重要的模型不拟合,这在任何应用贝叶斯分析中都至关重要,因为不充分的模型可能会误导决策。
History
Rubin于1984年提出了贝叶斯预测检验;Gelman、Meng和Stern于1996年对其进行了扩展,引入了依赖于参数的已实现差异(realized discrepancies)。该方法已成为应用贝叶斯工作流程中的标准实践,通常通过图形检验进行。
Debates
- 数据的双重使用
- 由于相同的数据既用于拟合模型又用于检验,后验预测p值具有保守性,并且在零假设下不均匀分布,这促使人们寻求替代方法,例如交叉验证检验。
Key figures
- Donald Rubin
- Andrew Gelman
- Xiao-Li Meng
- Hal Stern
Related topics
Seminal works
- gelman1996
- rubin1984
Frequently asked questions
- 后验预测p值接近0.5是否意味着我的模型是正确的?
- 不是。后验预测检验可以揭示您所检验特征中的不拟合,但不能证实模型是正确的;非极端的p值仅表示该模型未被该特定检验量所矛盾。