Redes Bayesianas
Uma rede Bayesiana é um grafo acíclico dirigido cujos nós são variáveis aleatórias e cujas arestas codificam dependências condicionais, fornecendo uma representação compacta de uma distribuição de probabilidade conjunta.
Definition
Uma rede Bayesiana é um modelo gráfico probabilístico que consiste em um grafo acíclico dirigido sobre variáveis aleatórias, juntamente com uma distribuição de probabilidade condicional para cada variável, dadas suas variáveis parentes, que definem conjuntamente uma distribuição completa sobre todas as variáveis.
Scope
Este tópico abrange a estrutura e a semântica das redes Bayesianas (de crença): o grafo acíclico dirigido, as distribuições de probabilidade condicional locais, a fatoração da distribuição conjunta pela regra da cadeia e as relações de independência que elas codificam (a condição de Markov e a d-separação). Ele aborda como uma rede é lida como um modelo de independência condicional e como ela armazena compactamente uma distribuição exponencialmente grande. Algoritmos de inferência sobre essas redes são tratados no tópico relacionado de inferência probabilística, e a aprendizagem de sua estrutura ou parâmetros a partir de dados pertence ao subcampo de aprendizado de máquina.
Core questions
- Como um grafo acíclico dirigido mais distribuições condicionais locais especificam uma distribuição conjunta completa?
- Que relações de independência condicional a estrutura da rede codifica?
- Como a d-separação determina se duas variáveis são independentes dadas as evidências observadas?
- Por que a representação fatorada requer muito menos números do que a distribuição conjunta completa?
Key concepts
- grafo acíclico dirigido
- tabelas de probabilidade condicional
- fatoração pela regra da cadeia
- condição de Markov
- d-separação
- parentes e descendentes
- distribuição conjunta compacta
- modelo gráfico
Key theories
- Fatoração via condição de Markov
- Uma rede Bayesiana afirma que cada variável é condicionalmente independente de seus não-descendentes, dadas suas variáveis parentes, de modo que a distribuição conjunta se fatoriza no produto da distribuição condicional de cada variável, dadas suas variáveis parentes, resultando em uma enorme economia de parâmetros.
- d-separação e independência
- O critério gráfico de d-separação lê as independências condicionais diretamente da estrutura da rede, caracterizando exatamente quais afirmações de independência são implicadas pelo grafo, independentemente dos parâmetros numéricos.
- Redes de crença como inferência plausível
- A estrutura de redes de crença de Pearl mostrou como as probabilidades condicionais locais e a passagem de mensagens capturam inferência plausível coerente, estabelecendo modelos gráficos dirigidos como uma ferramenta sólida e prática para representar conhecimento incerto.
Clinical relevance
As redes Bayesianas são utilizadas para diagnóstico médico, análise de falhas e riscos, fusão de sensores, modelagem de redes reguladoras de genes e outras redes biológicas, e suporte à decisão, pois tornam explícitas as complexas dependências probabilísticas e permitem que as evidências sejam propagadas para atualizar as crenças sobre variáveis não observadas.
History
As redes Bayesianas foram desenvolvidas por Judea Pearl na década de 1980 como um formalismo gráfico para inferência plausível, totalmente exposto em seu livro de 1988. Elas unificaram ideias probabilísticas e gráficas anteriores, tornaram-se o modelo gráfico dirigido canônico e foram posteriormente estendidas e sistematizadas na literatura de modelos gráficos probabilísticos.
Key figures
- Judea Pearl
- Daphne Koller
- Nir Friedman
- David Heckerman
Related topics
Seminal works
- pearl1986
- pearl1988
Frequently asked questions
- Por que as redes Bayesianas são mais compactas do que uma distribuição conjunta completa?
- Uma distribuição conjunta completa sobre n variáveis binárias necessita de cerca de 2^n números. Uma rede Bayesiana armazena apenas, para cada variável, sua probabilidade dadas suas variáveis parentes, de modo que, quando cada variável tem poucos parentes, o número total de parâmetros cresce aproximadamente linearmente em vez de exponencialmente no número de variáveis.
- O que a d-separação indica?
- A d-separação é um teste gráfico que determina, apenas a partir da estrutura da rede, se dois conjuntos de variáveis são condicionalmente independentes dado um terceiro conjunto de variáveis observadas. Isso permite ler as relações de independência do grafo sem examinar os números de probabilidade reais.