事後予測p値が0.5に近い場合、私のモデルは正しいということですか？

いいえ。事後予測チェックは、テストする特徴における不適合を明らかにすることはできますが、モデルが正しいことを確認することはできません。極端でないp値は、その特定の検定統計量によってモデルが矛盾しないことを意味するにすぎません。

事後予測チェック

事後予測チェックは、観測データと、適合モデルからシミュレートされたデータを比較することにより、絶対的なモデル適合度を評価します。

PaperMindでテーマを探す近日公開Find papers & topics

Tools & resources

Learn & explore

動画近日公開

事後予測チェックは、適合モデルの事後予測分布から複製データを生成し、これらの複製の特性を観測データの同じ特性と比較することで、モデルの不適合の証拠として体系的な不一致を指摘します。

このトピックでは、事後予測分布からの複製データセットのシミュレーション、検定統計量と不一致尺度の使用、グラフィカルチェック、および事後予測p値について、仮説検定としてではなく自己整合性としての解釈とともに扱います。

複製データ比較: モデルが適合していれば、そこからシミュレートされたデータは関連する点で観測データに類似しているはずです。選択された検定統計量における体系的な違いは、モデルがどこで失敗しているかを示します。
事後予測p値: 事後予測p値は、複製データに対する不一致尺度が観測データに対するそれを超える確率です。これはグラフィカルな診断ツールであり、保守的であり、調整された頻度主義的検定ではありません。

事後予測チェックにより、アナリストは結論を報告する前に重要なモデルの不適合を検出できます。これは、不適切なモデルが意思決定を誤導する可能性がある、あらゆる応用ベイズ分析において重要です。

ルービンは1984年にベイズ予測チェックを提案し、ゲルマン、メン、スターンは1996年にパラメーターに依存する実現された不一致を用いてこれを拡張しました。このアプローチは、応用ベイズワークフローにおける標準的な実践となり、しばしばグラフィカルチェックを介して行われます。

データの二重使用: 同じデータが適合モデルとチェックの両方に情報を提供するため、事後予測p値は保守的であり、帰無仮説の下で一様に分布しないため、交差検定チェックなどの代替案が提案されています。

事後予測p値が0.5に近い場合、私のモデルは正しいということですか？: いいえ。事後予測チェックは、テストする特徴における不適合を明らかにすることはできますが、モデルが正しいことを確認することはできません。極端でないp値は、その特定の検定統計量によってモデルが矛盾しないことを意味するにすぎません。