事後予測チェック
事後予測チェックは、観測データと、適合モデルからシミュレートされたデータを比較することにより、絶対的なモデル適合度を評価します。
PaperMindでテーマを探す近日公開Find papers & topics
Tools & resources
Learn & explore
動画近日公開
Definition
事後予測チェックは、適合モデルの事後予測分布から複製データを生成し、これらの複製の特性を観測データの同じ特性と比較することで、モデルの不適合の証拠として体系的な不一致を指摘します。
Scope
このトピックでは、事後予測分布からの複製データセットのシミュレーション、検定統計量と不一致尺度の使用、グラフィカルチェック、および事後予測p値について、仮説検定としてではなく自己整合性としての解釈とともに扱います。
Core questions
- 事後予測分布から複製データセットはどのように抽出されますか?
- 検定統計量と不一致尺度とは何ですか、またそれらはどのように選択されますか?
- 事後予測p値はどのように計算され、解釈されますか?
- 事後予測チェックがモデル選択ルールではなく、適合度のチェックであるのはなぜですか?
Key concepts
- 事後予測分布
- 複製データ
- 検定統計量
- 不一致尺度
- 事後予測p値
- グラフィカルモデルチェック
Key theories
- 複製データ比較
- モデルが適合していれば、そこからシミュレートされたデータは関連する点で観測データに類似しているはずです。選択された検定統計量における体系的な違いは、モデルがどこで失敗しているかを示します。
- 事後予測p値
- 事後予測p値は、複製データに対する不一致尺度が観測データに対するそれを超える確率です。これはグラフィカルな診断ツールであり、保守的であり、調整された頻度主義的検定ではありません。
Clinical relevance
事後予測チェックにより、アナリストは結論を報告する前に重要なモデルの不適合を検出できます。これは、不適切なモデルが意思決定を誤導する可能性がある、あらゆる応用ベイズ分析において重要です。
History
ルービンは1984年にベイズ予測チェックを提案し、ゲルマン、メン、スターンは1996年にパラメーターに依存する実現された不一致を用いてこれを拡張しました。このアプローチは、応用ベイズワークフローにおける標準的な実践となり、しばしばグラフィカルチェックを介して行われます。
Debates
- データの二重使用
- 同じデータが適合モデルとチェックの両方に情報を提供するため、事後予測p値は保守的であり、帰無仮説の下で一様に分布しないため、交差検定チェックなどの代替案が提案されています。
Key figures
- Donald Rubin
- Andrew Gelman
- Xiao-Li Meng
- Hal Stern
Related topics
Seminal works
- gelman1996
- rubin1984
Frequently asked questions
- 事後予測p値が0.5に近い場合、私のモデルは正しいということですか?
- いいえ。事後予測チェックは、テストする特徴における不適合を明らかにすることはできますが、モデルが正しいことを確認することはできません。極端でないp値は、その特定の検定統計量によってモデルが矛盾しないことを意味するにすぎません。