بررسیهای پیشبینانه پسین
بررسیهای پیشبینانه پسین با مقایسه دادههای مشاهدهشده با دادههای شبیهسازیشده از مدل برازشیافته، برازش مطلق مدل را ارزیابی میکنند.
Definition
بررسی پیشبینانه پسین، دادههای تکراری را از توزیع پیشبینانه پسین یک مدل برازشیافته تولید میکند و ویژگیهای این تکرارها را با همان ویژگیهای دادههای مشاهدهشده مقایسه میکند و ناهمخوانیهای سیستماتیک را به عنوان شواهدی از عدم برازش مدل نشان میدهد.
Scope
این مبحث شامل شبیهسازی مجموعهدادههای تکراری از توزیع پیشبینانه پسین، استفاده از مقادیر آزمون و معیارهای ناهمخوانی، بررسیهای گرافیکی، و مقادیر p پیشبینانه پسین، همراه با تفسیر آنها به عنوان یک خودسازگاری و نه یک آزمون فرضیه، میشود.
Core questions
- چگونه مجموعهدادههای تکراری از توزیع پیشبینانه پسین استخراج میشوند؟
- مقادیر آزمون و معیارهای ناهمخوانی چه هستند و چگونه انتخاب میشوند؟
- مقدار p پیشبینانه پسین چگونه محاسبه و تفسیر میشود؟
- چرا بررسی پیشبینانه پسین یک بررسی برازش است و نه یک قاعده انتخاب مدل؟
Key concepts
- توزیع پیشبینانه پسین
- دادههای تکراری
- مقدار آزمون
- معیار ناهمخوانی
- مقدار p پیشبینانه پسین
- بررسی مدل گرافیکی
Key theories
- مقایسه دادههای تکراری
- اگر یک مدل برازش داشته باشد، دادههای شبیهسازیشده از آن باید در جنبههای مرتبط به دادههای مشاهدهشده شباهت داشته باشند؛ تفاوتهای سیستماتیک در مقادیر آزمون انتخابشده نشان میدهد که مدل در کجا دچار نقص است.
- مقادیر p پیشبینانه پسین
- مقدار p پیشبینانه پسین، احتمال این است که یک معیار ناهمخوانی برای دادههای تکراری از آن برای دادههای مشاهدهشده بیشتر باشد؛ این یک ابزار گرافیکی و تشخیصی است، محافظهکارانه است و یک آزمون فراوانیگرای کالیبرهشده نیست.
Clinical relevance
بررسیهای پیشبینانه پسین به تحلیلگران اجازه میدهد تا قبل از گزارش نتایج، عدم برازش مهم مدل را شناسایی کنند، که در هر تحلیل بیزی کاربردی که یک مدل ناکافی میتواند منجر به تصمیمات گمراهکننده شود، اهمیت دارد.
History
روبین (Rubin) بررسی پیشبینانه بیزی را در سال ۱۹۸۴ پیشنهاد کرد؛ گلمن (Gelman)، منگ (Meng) و استرن (Stern) آن را با ناهمخوانیهای تحققیافته وابسته به پارامترها در سال ۱۹۹۶ گسترش دادند. این رویکرد به یک روش استاندارد در جریانهای کاری بیزی کاربردی تبدیل شده است که اغلب از طریق بررسیهای گرافیکی انجام میشود.
Debates
- استفاده دوگانه از دادهها
- از آنجا که دادههای یکسان هم مدل برازشیافته و هم بررسی را اطلاعرسانی میکنند، مقادیر p پیشبینانه پسین محافظهکارانه هستند و تحت فرضیه صفر به طور یکنواخت توزیع نمیشوند، که منجر به پیشنهاد جایگزینهایی مانند بررسیهای اعتبارسنجی متقابل میشود.
Key figures
- Donald Rubin
- Andrew Gelman
- Xiao-Li Meng
- Hal Stern
Related topics
Seminal works
- gelman1996
- rubin1984
Frequently asked questions
- آیا مقدار p پیشبینانه پسین نزدیک به ۰.۵ به این معنی است که مدل من صحیح است؟
- خیر. بررسیهای پیشبینانه پسین میتوانند عدم برازش را در ویژگیهایی که شما آزمایش میکنید آشکار کنند اما نمیتوانند صحت یک مدل را تأیید کنند؛ یک مقدار p غیر افراطی تنها به این معنی است که مدل توسط آن مقدار آزمون خاص نقض نمیشود.