Por que não escolher apenas o melhor modelo único?

Selecionar um modelo ignora a incerteza sobre qual modelo está correto e pode produzir previsões excessivamente confiantes; a média sobre os modelos, ou o empilhamento (stacking) deles, propaga essa incerteza e geralmente melhora a calibração preditiva.

Média de Modelos Bayesiana

A média de modelos bayesiana considera a incerteza sobre qual modelo está correto, combinando as previsões de todos os modelos candidatos, ponderadas por suas probabilidades posteriores.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

A média de modelos bayesiana forma previsões e inferências tomando uma média ponderada sobre um conjunto de modelos candidatos, com pesos iguais à probabilidade posterior de cada modelo dados os dados, incorporando assim a incerteza do modelo na resposta final.

Scope

Este tópico abrange a formulação da média de modelos em um espaço de modelos, as probabilidades posteriores dos modelos como pesos, seu benefício para a previsão calibrada sob incerteza do modelo, os desafios práticos de grandes espaços de modelos e alternativas preditivas como o empilhamento (stacking).

Core questions

Como as previsões são calculadas em média entre os modelos usando probabilidades posteriores do modelo?
Por que a média de modelos melhora a calibração preditiva sob incerteza do modelo?
Como espaços de modelos grandes ou infinitos são tratados na prática?
Como o empilhamento (stacking) difere da ponderação por probabilidade posterior?

Key concepts

probabilidade posterior do modelo
espaço de modelos
incerteza do modelo
média preditiva
empilhamento (stacking)
janela de Occam (Occam's window)

Key theories

Média sobre o espaço de modelos: Tratar o índice do modelo como uma incógnita com sua própria posterior produz previsões que se integram sobre os modelos, o que, sob a suposição de que o modelo verdadeiro está no conjunto, é ótimo para a previsão.
Empilhamento preditivo (Predictive stacking): Quando nenhum candidato está exatamente correto, o empilhamento (stacking) escolhe pesos de combinação para maximizar o desempenho preditivo validado cruzadamente, frequentemente superando a ponderação por probabilidade posterior na prática.

Clinical relevance

A média de modelos produz uma incerteza preditiva mais honesta em campos como projeção climática, previsão epidemiológica e economia, onde o compromisso com um único modelo subestimaria a verdadeira incerteza.

History

A média de modelos bayesiana foi desenvolvida ao longo da década de 1990 e sintetizada no tutorial de 1999 por Hoeting e colegas. O reconhecimento de que o modelo verdadeiro raramente está no conjunto de candidatos motivou posteriormente o empilhamento preditivo (predictive stacking) como um método de combinação mais robusto.

Debates

Ponderação por probabilidade do modelo versus empilhamento (stacking): Quando todos os modelos candidatos estão errados, os pesos de probabilidade posterior podem se concentrar em um único modelo inadequado, então o empilhamento preditivo (predictive stacking) é cada vez mais preferido para combinar modelos para previsão.

Key figures

Adrian Raftery
David Madigan
Jennifer Hoeting
Andrew Gelman

Seminal works

hoeting1999
yao2018

Frequently asked questions

Por que não escolher apenas o melhor modelo único?: Selecionar um modelo ignora a incerteza sobre qual modelo está correto e pode produzir previsões excessivamente confiantes; a média sobre os modelos, ou o empilhamento (stacking) deles, propaga essa incerteza e geralmente melhora a calibração preditiva.