معايير المعلومات التنبؤية
تقدّر معايير المعلومات التنبؤية دقة النموذج المتوقعة خارج العينة من خلال تقديرها اللاحق، مما يوفر بديلاً يركز على التنبؤ لعوامل بايز لمقارنة النماذج.
Definition
معايير المعلومات التنبؤية هي تقديرات لكثافة السجل التنبؤية المتوقعة للنموذج على بيانات جديدة، تُحسب من عينات لاحقة وتُصحح للتجهيز الزائد (overfitting) بواسطة عقوبة المعلمة الفعالة، وتُستخدم لترتيب النماذج حسب الأداء التنبؤي.
Scope
يغطي هذا الموضوع معيار انحراف المعلومات (DIC)، ومعيار المعلومات المطبق على نطاق واسع (WAIC)، والتحقق المتقاطع الفعال لترك واحد خارجًا بأخذ العينات الأهمية الملساء بباريتو، بما في ذلك كيفية تقدير كل منها للعدد الفعال للمعلمات وتقريب كثافة السجل التنبؤية المتوقعة.
Core questions
- كيف تقدر معايير DIC و WAIC والتحقق المتقاطع لترك واحد خارجًا الدقة التنبؤية؟
- ما هو العدد الفعال للمعلمات وكيف يتم حسابه؟
- لماذا يعتبر WAIC أكثر بايزية بالكامل من DIC؟
- كيف يجعل أخذ العينات الأهمية الملساء بباريتو التحقق المتقاطع لترك واحد خارجًا فعالاً؟
Key concepts
- معيار انحراف المعلومات (DIC)
- معيار المعلومات المطبق على نطاق واسع (WAIC)
- التحقق المتقاطع لترك واحد خارجًا
- كثافة السجل التنبؤية المتوقعة
- العدد الفعال للمعلمات
- أخذ العينات الأهمية الملساء بباريتو
- عقوبة التجهيز الزائد
Key theories
- العدد الفعال للمعلمات
- يعاقب كل معيار الملاءمة بتقدير لتعقيد النموذج مشتق من تباين الاحتمالية اللوغاريتمية عبر التقدير اللاحق، بحيث لا تفوز الملاءمة الأفضل داخل العينة تلقائيًا.
- تكافؤ WAIC والتحقق المتقاطع
- أظهر واتانابي أن WAIC مكافئ تقاربيًا للتحقق المتقاطع البايزي لترك واحد خارجًا، وكلاهما يستهدف مباشرة كثافة السجل التنبؤية المتوقعة خارج العينة باستخدام التقدير اللاحق الكامل.
Clinical relevance
تتيح المعايير التنبؤية للباحثين مقارنة النماذج المرشحة للتنبؤ في علم الأوبئة والبيئة والعلوم الفيزيائية دون تحديد التقديرات المسبقة المضبوطة بدقة التي تتطلبها عوامل بايز.
History
اقترح سبيجلهالتر وزملاؤه معيار DIC في عام 2002؛ وقدم واتانابي معيار WAIC من نظرية التعلم الفردي في عام 2010. وقد جعل عمل فيهتاري وجيلمان وغابري في عام 2017 حول التحقق المتقاطع لترك واحد خارجًا بأخذ العينات الأهمية الملساء بباريتو التقييم التنبؤي المستقر والقابل للتشخيص عمليًا.
Debates
- موثوقية DIC
- يمكن أن يتصرف DIC بشكل سيء للنماذج الهرمية وغير المنتظمة ويفتقر إلى الثبات، مما يدفع الكثيرين إلى تفضيل WAIC أو التحقق المتقاطع لترك واحد خارجًا، على الرغم من عدم وجود معيار واحد هو الأفضل عالميًا.
Key figures
- David Spiegelhalter
- Sumio Watanabe
- Aki Vehtari
- Andrew Gelman
Related topics
Seminal works
- watanabe2010
- vehtari2017
Frequently asked questions
- هل المعيار المعلوماتي الأقل أم الأعلى أفضل؟
- عادةً ما تُبلغ هذه المعايير على مقياس الانحراف حيث تشير القيم الأقل إلى دقة تنبؤية أفضل مقدرة خارج العينة؛ يجب الحكم على الفروق بالنسبة لأخطائها المعيارية بدلاً من التعامل معها على أنها دقيقة.