Por que as redes Bayesianas são mais compactas do que uma distribuição conjunta completa?

Uma distribuição conjunta completa sobre n variáveis binárias necessita de cerca de 2^n números. Uma rede Bayesiana armazena apenas, para cada variável, sua probabilidade dadas suas variáveis parentes, de modo que, quando cada variável tem poucos parentes, o número total de parâmetros cresce aproximadamente linearmente em vez de exponencialmente no número de variáveis.

O que a d-separação indica?

A d-separação é um teste gráfico que determina, apenas a partir da estrutura da rede, se dois conjuntos de variáveis são condicionalmente independentes dado um terceiro conjunto de variáveis observadas. Isso permite ler as relações de independência do grafo sem examinar os números de probabilidade reais.

Redes Bayesianas

Uma rede Bayesiana é um grafo acíclico dirigido cujos nós são variáveis aleatórias e cujas arestas codificam dependências condicionais, fornecendo uma representação compacta de uma distribuição de probabilidade conjunta.

Encontrar tema com PaperMindEm breveFind papers & topics

Tools & resources

Baixar slides

Learn & explore

VídeoEm breve

Definition

Uma rede Bayesiana é um modelo gráfico probabilístico que consiste em um grafo acíclico dirigido sobre variáveis aleatórias, juntamente com uma distribuição de probabilidade condicional para cada variável, dadas suas variáveis parentes, que definem conjuntamente uma distribuição completa sobre todas as variáveis.

Scope

Este tópico abrange a estrutura e a semântica das redes Bayesianas (de crença): o grafo acíclico dirigido, as distribuições de probabilidade condicional locais, a fatoração da distribuição conjunta pela regra da cadeia e as relações de independência que elas codificam (a condição de Markov e a d-separação). Ele aborda como uma rede é lida como um modelo de independência condicional e como ela armazena compactamente uma distribuição exponencialmente grande. Algoritmos de inferência sobre essas redes são tratados no tópico relacionado de inferência probabilística, e a aprendizagem de sua estrutura ou parâmetros a partir de dados pertence ao subcampo de aprendizado de máquina.

Core questions

Como um grafo acíclico dirigido mais distribuições condicionais locais especificam uma distribuição conjunta completa?
Que relações de independência condicional a estrutura da rede codifica?
Como a d-separação determina se duas variáveis são independentes dadas as evidências observadas?
Por que a representação fatorada requer muito menos números do que a distribuição conjunta completa?

Key concepts

grafo acíclico dirigido
tabelas de probabilidade condicional
fatoração pela regra da cadeia
condição de Markov
d-separação
parentes e descendentes
distribuição conjunta compacta
modelo gráfico

Key theories

Fatoração via condição de Markov: Uma rede Bayesiana afirma que cada variável é condicionalmente independente de seus não-descendentes, dadas suas variáveis parentes, de modo que a distribuição conjunta se fatoriza no produto da distribuição condicional de cada variável, dadas suas variáveis parentes, resultando em uma enorme economia de parâmetros.
d-separação e independência: O critério gráfico de d-separação lê as independências condicionais diretamente da estrutura da rede, caracterizando exatamente quais afirmações de independência são implicadas pelo grafo, independentemente dos parâmetros numéricos.
Redes de crença como inferência plausível: A estrutura de redes de crença de Pearl mostrou como as probabilidades condicionais locais e a passagem de mensagens capturam inferência plausível coerente, estabelecendo modelos gráficos dirigidos como uma ferramenta sólida e prática para representar conhecimento incerto.

Clinical relevance

As redes Bayesianas são utilizadas para diagnóstico médico, análise de falhas e riscos, fusão de sensores, modelagem de redes reguladoras de genes e outras redes biológicas, e suporte à decisão, pois tornam explícitas as complexas dependências probabilísticas e permitem que as evidências sejam propagadas para atualizar as crenças sobre variáveis não observadas.

History

As redes Bayesianas foram desenvolvidas por Judea Pearl na década de 1980 como um formalismo gráfico para inferência plausível, totalmente exposto em seu livro de 1988. Elas unificaram ideias probabilísticas e gráficas anteriores, tornaram-se o modelo gráfico dirigido canônico e foram posteriormente estendidas e sistematizadas na literatura de modelos gráficos probabilísticos.

Key figures

Judea Pearl
Daphne Koller
Nir Friedman
David Heckerman

Seminal works

pearl1986
pearl1988

Frequently asked questions

Por que as redes Bayesianas são mais compactas do que uma distribuição conjunta completa?: Uma distribuição conjunta completa sobre n variáveis binárias necessita de cerca de 2^n números. Uma rede Bayesiana armazena apenas, para cada variável, sua probabilidade dadas suas variáveis parentes, de modo que, quando cada variável tem poucos parentes, o número total de parâmetros cresce aproximadamente linearmente em vez de exponencialmente no número de variáveis.
O que a d-separação indica?: A d-separação é um teste gráfico que determina, apenas a partir da estrutura da rede, se dois conjuntos de variáveis são condicionalmente independentes dado um terceiro conjunto de variáveis observadas. Isso permite ler as relações de independência do grafo sem examinar os números de probabilidade reais.