Média de Modelos Bayesiana
A média de modelos bayesiana considera a incerteza sobre qual modelo está correto, combinando as previsões de todos os modelos candidatos, ponderadas por suas probabilidades posteriores.
Definition
A média de modelos bayesiana forma previsões e inferências tomando uma média ponderada sobre um conjunto de modelos candidatos, com pesos iguais à probabilidade posterior de cada modelo dados os dados, incorporando assim a incerteza do modelo na resposta final.
Scope
Este tópico abrange a formulação da média de modelos em um espaço de modelos, as probabilidades posteriores dos modelos como pesos, seu benefício para a previsão calibrada sob incerteza do modelo, os desafios práticos de grandes espaços de modelos e alternativas preditivas como o empilhamento (stacking).
Core questions
- Como as previsões são calculadas em média entre os modelos usando probabilidades posteriores do modelo?
- Por que a média de modelos melhora a calibração preditiva sob incerteza do modelo?
- Como espaços de modelos grandes ou infinitos são tratados na prática?
- Como o empilhamento (stacking) difere da ponderação por probabilidade posterior?
Key concepts
- probabilidade posterior do modelo
- espaço de modelos
- incerteza do modelo
- média preditiva
- empilhamento (stacking)
- janela de Occam (Occam's window)
Key theories
- Média sobre o espaço de modelos
- Tratar o índice do modelo como uma incógnita com sua própria posterior produz previsões que se integram sobre os modelos, o que, sob a suposição de que o modelo verdadeiro está no conjunto, é ótimo para a previsão.
- Empilhamento preditivo (Predictive stacking)
- Quando nenhum candidato está exatamente correto, o empilhamento (stacking) escolhe pesos de combinação para maximizar o desempenho preditivo validado cruzadamente, frequentemente superando a ponderação por probabilidade posterior na prática.
Clinical relevance
A média de modelos produz uma incerteza preditiva mais honesta em campos como projeção climática, previsão epidemiológica e economia, onde o compromisso com um único modelo subestimaria a verdadeira incerteza.
History
A média de modelos bayesiana foi desenvolvida ao longo da década de 1990 e sintetizada no tutorial de 1999 por Hoeting e colegas. O reconhecimento de que o modelo verdadeiro raramente está no conjunto de candidatos motivou posteriormente o empilhamento preditivo (predictive stacking) como um método de combinação mais robusto.
Debates
- Ponderação por probabilidade do modelo versus empilhamento (stacking)
- Quando todos os modelos candidatos estão errados, os pesos de probabilidade posterior podem se concentrar em um único modelo inadequado, então o empilhamento preditivo (predictive stacking) é cada vez mais preferido para combinar modelos para previsão.
Key figures
- Adrian Raftery
- David Madigan
- Jennifer Hoeting
- Andrew Gelman
Related topics
Seminal works
- hoeting1999
- yao2018
Frequently asked questions
- Por que não escolher apenas o melhor modelo único?
- Selecionar um modelo ignora a incerteza sobre qual modelo está correto e pode produzir previsões excessivamente confiantes; a média sobre os modelos, ou o empilhamento (stacking) deles, propaga essa incerteza e geralmente melhora a calibração preditiva.