การตรวจสอบเชิงพยากรณ์จากค่าเบย์ (Posterior Predictive Checks)
การตรวจสอบเชิงพยากรณ์จากค่าเบย์เป็นการประเมินความเหมาะสมของแบบจำลองโดยเปรียบเทียบข้อมูลที่สังเกตได้กับข้อมูลที่จำลองขึ้นจากแบบจำลองที่ปรับให้เข้ากันแล้ว
Definition
การตรวจสอบเชิงพยากรณ์จากค่าเบย์สร้างข้อมูลจำลองซ้ำจากส่วนกระจายเชิงพยากรณ์จากค่าเบย์ของแบบจำลองที่ปรับให้เข้ากันแล้ว และเปรียบเทียบลักษณะของข้อมูลจำลองซ้ำเหล่านี้กับลักษณะเดียวกันของข้อมูลที่สังเกตได้ โดยระบุความคลาดเคลื่อนที่เป็นระบบว่าเป็นหลักฐานของความไม่เหมาะสมของแบบจำลอง
Scope
หัวข้อนี้ครอบคลุมการจำลองชุดข้อมูลจำลองซ้ำจากส่วนกระจายเชิงพยากรณ์จากค่าเบย์ การใช้ปริมาณทดสอบและมาตรวัดความคลาดเคลื่อน การตรวจสอบด้วยกราฟ และค่า p-value เชิงพยากรณ์จากค่าเบย์ รวมถึงการตีความว่าเป็นความสอดคล้องในตัวเองมากกว่าการทดสอบสมมติฐาน
Core questions
- ชุดข้อมูลจำลองซ้ำถูกดึงมาจากส่วนกระจายเชิงพยากรณ์จากค่าเบย์ได้อย่างไร?
- ปริมาณทดสอบและมาตรวัดความคลาดเคลื่อนคืออะไร และเลือกได้อย่างไร?
- ค่า p-value เชิงพยากรณ์จากค่าเบย์คำนวณและตีความได้อย่างไร?
- เหตุใดการตรวจสอบเชิงพยากรณ์จากค่าเบย์จึงเป็นการตรวจสอบความเหมาะสมมากกว่ากฎการเลือกแบบจำลอง?
Key concepts
- ส่วนกระจายเชิงพยากรณ์จากค่าเบย์
- ข้อมูลจำลองซ้ำ
- ปริมาณทดสอบ
- มาตรวัดความคลาดเคลื่อน
- ค่า p-value เชิงพยากรณ์จากค่าเบย์
- การตรวจสอบแบบจำลองด้วยกราฟ
Key theories
- การเปรียบเทียบข้อมูลจำลองซ้ำ
- หากแบบจำลองมีความเหมาะสม ข้อมูลที่จำลองจากแบบจำลองนั้นควรมีลักษณะคล้ายกับข้อมูลที่สังเกตได้ในแง่มุมที่เกี่ยวข้อง; ความแตกต่างที่เป็นระบบในปริมาณทดสอบที่เลือกจะเปิดเผยว่าแบบจำลองล้มเหลวในจุดใด
- ค่า p-value เชิงพยากรณ์จากค่าเบย์
- ค่า p-value เชิงพยากรณ์จากค่าเบย์คือความน่าจะเป็นที่มาตรวัดความคลาดเคลื่อนสำหรับข้อมูลจำลองซ้ำจะเกินกว่าค่าสำหรับข้อมูลที่สังเกตได้; เป็นเครื่องมือทางกราฟิกและการวินิจฉัย ซึ่งเป็นค่าที่อนุรักษ์นิยมและไม่ใช่การทดสอบแบบถี่ที่ปรับเทียบแล้ว
Clinical relevance
การตรวจสอบเชิงพยากรณ์จากค่าเบย์ช่วยให้นักวิเคราะห์สามารถตรวจจับความไม่เหมาะสมที่สำคัญของแบบจำลองก่อนที่จะรายงานข้อสรุป ซึ่งมีความสำคัญในการวิเคราะห์แบบเบย์ประยุกต์ใดๆ ที่แบบจำลองที่ไม่เพียงพออาจนำไปสู่การตัดสินใจที่ผิดพลาดได้
History
รูบินเสนอการตรวจสอบเชิงพยากรณ์แบบเบย์ในปี 1984; เกลแมน, เม้ง และสเติร์นได้ขยายแนวคิดนี้โดยใช้ความคลาดเคลื่อนที่เกิดขึ้นจริงซึ่งขึ้นอยู่กับพารามิเตอร์ในปี 1996 แนวทางนี้ได้กลายเป็นแนวปฏิบัติมาตรฐานในการทำงานแบบเบย์ประยุกต์ ซึ่งมักจะผ่านการตรวจสอบด้วยกราฟ
Debates
- การใช้ข้อมูลซ้ำซ้อน
- เนื่องจากข้อมูลชุดเดียวกันถูกใช้ทั้งในการสร้างแบบจำลองที่ปรับให้เข้ากันแล้วและการตรวจสอบ ค่า p-value เชิงพยากรณ์จากค่าเบย์จึงเป็นค่าที่อนุรักษ์นิยมและไม่ได้มีการกระจายอย่างสม่ำเสมอภายใต้สมมติฐานว่าง ซึ่งกระตุ้นให้เกิดทางเลือกอื่น เช่น การตรวจสอบแบบ cross-validated
Key figures
- Donald Rubin
- Andrew Gelman
- Xiao-Li Meng
- Hal Stern
Related topics
Seminal works
- gelman1996
- rubin1984
Frequently asked questions
- ค่า p-value เชิงพยากรณ์จากค่าเบย์ที่ใกล้เคียง 0.5 หมายความว่าแบบจำลองของฉันถูกต้องหรือไม่?
- ไม่ การตรวจสอบเชิงพยากรณ์จากค่าเบย์สามารถเปิดเผยความไม่เหมาะสมในลักษณะที่คุณทดสอบได้ แต่ไม่สามารถยืนยันได้ว่าแบบจำลองถูกต้อง; ค่า p-value ที่ไม่สุดโต่งเพียงแค่หมายความว่าแบบจำลองไม่ขัดแย้งกับปริมาณทดสอบเฉพาะนั้น