ScholarGate
Assistent

Prädiktive Informationskriterien

Prädiktive Informationskriterien schätzen die erwartete Out-of-Sample-Genauigkeit eines Modells anhand seiner Posterior-Verteilung und bieten eine prädiktionsorientierte Alternative zu Bayes-Faktoren für den Modellvergleich.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Prädiktive Informationskriterien sind Schätzungen der erwarteten log-prädiktiven Dichte eines Modells auf neuen Daten, berechnet aus Posterior-Stichproben und korrigiert für Overfitting durch eine Strafe für effektive Parameter, die zur Rangfolge von Modellen nach ihrer prädiktiven Leistung verwendet werden.

Scope

Dieses Thema behandelt das Deviance Information Criterion (DIC), das Widely Applicable Information Criterion (WAIC) und die effiziente Pareto-geglättete Importance-Sampling Leave-One-Out-Kreuzvalidierung, einschließlich der Schätzung der effektiven Anzahl von Parametern und der Approximation der erwarteten log-prädiktiven Dichte durch jedes dieser Kriterien.

Core questions

  • Wie schätzen DIC, WAIC und die Leave-One-Out-Kreuzvalidierung die prädiktive Genauigkeit ein?
  • Was ist die effektive Anzahl von Parametern und wie wird sie berechnet?
  • Warum wird WAIC als vollständiger bayesianisch angesehen als DIC?
  • Wie macht Pareto-geglättetes Importance Sampling die Leave-One-Out-Kreuzvalidierung effizient?

Key concepts

  • DIC
  • WAIC
  • Leave-One-Out-Kreuzvalidierung
  • erwartete log-prädiktive Dichte
  • effektive Anzahl von Parametern
  • Pareto-geglättetes Importance Sampling
  • Overfitting-Strafe

Key theories

Effektive Anzahl von Parametern
Jedes Kriterium bestraft die Anpassung durch eine Schätzung der Modellkomplexität, die aus der Variabilität der Log-Likelihood über die Posterior-Verteilung abgeleitet wird, sodass eine bessere In-Sample-Anpassung nicht automatisch gewinnt.
WAIC und Kreuzvalidierungsäquivalenz
Watanabe zeigte, dass WAIC asymptotisch äquivalent zur bayesianischen Leave-One-Out-Kreuzvalidierung ist, und beide zielen direkt auf die erwartete Out-of-Sample-Log-Prädiktionsdichte unter Verwendung der vollständigen Posterior-Verteilung ab.

Clinical relevance

Prädiktive Kriterien ermöglichen es Forschern, Kandidatenmodelle für die Vorhersage in der Epidemiologie, Ökologie und den Naturwissenschaften zu vergleichen, ohne die sorgfältig abgestimmten Priors spezifizieren zu müssen, die Bayes-Faktoren erfordern.

History

Spiegelhalter und Kollegen schlugen DIC im Jahr 2002 vor; Watanabe führte WAIC aus der singulären Lerntheorie im Jahr 2010 ein. Die Arbeit von Vehtari, Gelman und Gabry aus dem Jahr 2017 zur Pareto-geglätteten Importance-Sampling Leave-One-Out-Kreuzvalidierung machte eine stabile, diagnostizierbare prädiktive Bewertung praktikabel.

Debates

Zuverlässigkeit von DIC
DIC kann bei hierarchischen und nicht-regulären Modellen schlecht funktionieren und ist nicht invariant, was viele dazu veranlasst, WAIC oder die Leave-One-Out-Kreuzvalidierung zu bevorzugen, obwohl kein einzelnes Kriterium universell das beste ist.

Key figures

  • David Spiegelhalter
  • Sumio Watanabe
  • Aki Vehtari
  • Andrew Gelman

Related topics

Seminal works

  • watanabe2010
  • vehtari2017

Frequently asked questions

Ist ein niedrigeres oder höheres Informationskriterium besser?
Diese Kriterien werden in der Regel auf einer Deviance-Skala angegeben, wobei niedrigere Werte eine bessere geschätzte Out-of-Sample-Prädiktionsgenauigkeit anzeigen; Unterschiede sollten relativ zu ihren Standardfehlern beurteilt und nicht als exakt behandelt werden.

Methods for this concept

Related concepts