Pourquoi les réseaux bayésiens sont-ils plus compacts qu'une distribution conjointe complète ?

Une distribution conjointe complète sur n variables binaires nécessite environ 2^n nombres. Un réseau bayésien ne stocke, pour chaque variable, que sa probabilité étant donné ses parents ; ainsi, lorsque chaque variable a peu de parents, le nombre total de paramètres croît approximativement linéairement plutôt qu'exponentiellement par rapport au nombre de variables.

Que nous apprend la d-séparation ?

La d-séparation est un test graphique qui détermine, à partir de la seule structure du réseau, si deux ensembles de variables sont conditionnellement indépendants étant donné un troisième ensemble de variables observées. Elle permet de lire les relations d'indépendance directement sur le graphe sans examiner les valeurs de probabilité réelles.

Réseaux bayésiens

Un réseau bayésien est un graphe orienté acyclique dont les nœuds représentent des variables aléatoires et dont les arêtes encodent des dépendances conditionnelles, offrant ainsi une représentation compacte d'une distribution de probabilité conjointe.

Trouver un sujet avec PaperMindBientôtFind papers & topics

Tools & resources

Télécharger les diapositives

Learn & explore

VidéoBientôt

Definition

Un réseau bayésien est un modèle graphique probabiliste composé d'un graphe orienté acyclique sur des variables aléatoires, associé à une distribution de probabilité conditionnelle pour chaque variable étant donné ses parents, l'ensemble définissant conjointement une distribution complète sur toutes les variables.

Scope

Ce sujet aborde la structure et la sémantique des réseaux bayésiens (ou réseaux de croyances) : le graphe orienté acyclique, les distributions de probabilité conditionnelles locales, la factorisation de la distribution conjointe par la règle de la chaîne, et les relations d'indépendance qu'ils encodent (la condition de Markov et la d-séparation). Il explique comment un réseau est interprété comme un modèle d'indépendance conditionnelle et comment il stocke de manière compacte une distribution de taille exponentielle. Les algorithmes d'inférence sur ces réseaux sont traités dans le sujet connexe de l'inférence probabiliste, et l'apprentissage de leur structure ou de leurs paramètres à partir de données relève du sous-domaine de l'apprentissage automatique.

Core questions

Comment un graphe orienté acyclique, combiné à des distributions conditionnelles locales, spécifie-t-il une distribution conjointe complète ?
Quelles relations d'indépendance conditionnelle la structure du réseau encode-t-elle ?
Comment la d-séparation détermine-t-elle si deux variables sont indépendantes étant donné des preuves observées ?
Pourquoi la représentation factorisée nécessite-t-elle beaucoup moins de nombres que la distribution conjointe complète ?

Key concepts

graphe orienté acyclique
tables de probabilité conditionnelle
factorisation par la règle de la chaîne
condition de Markov
d-séparation
parents et descendants
distribution conjointe compacte
modèle graphique

Key theories

Factorisation via la condition de Markov: Un réseau bayésien affirme que chaque variable est conditionnellement indépendante de ses non-descendants étant donné ses parents, de sorte que la distribution conjointe se factorise en le produit de la distribution conditionnelle de chaque variable étant donné ses parents, ce qui entraîne une économie considérable de paramètres.
d-séparation et indépendance: Le critère graphique de la d-séparation permet de lire les indépendances conditionnelles directement à partir de la structure du réseau, caractérisant précisément quelles déclarations d'indépendance sont impliquées par le graphe, indépendamment des paramètres numériques.
Les réseaux de croyances comme inférence plausible: Le cadre des réseaux de croyances de Pearl a montré comment les probabilités conditionnelles locales et la propagation de messages permettent une inférence plausible cohérente, établissant les modèles graphiques orientés comme un outil solide et pratique pour représenter des connaissances incertaines.

Clinical relevance

Les réseaux bayésiens sont utilisés pour le diagnostic médical, l'analyse des défaillances et des risques, la fusion de capteurs, la modélisation de réseaux de régulation génique et d'autres réseaux biologiques, ainsi que pour l'aide à la décision, car ils rendent explicites les dépendances probabilistes complexes et permettent de propager des preuves pour actualiser les croyances concernant des variables non observées.

History

Les réseaux bayésiens ont été développés par Judea Pearl dans les années 1980 comme un formalisme graphique pour l'inférence plausible, exposé en détail dans son livre de 1988. Ils ont unifié des idées probabilistes et graphiques antérieures, sont devenus le modèle graphique orienté canonique, et ont ensuite été étendus et systématisés dans la littérature des modèles graphiques probabilistes.

Key figures

Judea Pearl
Daphne Koller
Nir Friedman
David Heckerman

Seminal works

pearl1986
pearl1988

Frequently asked questions

Pourquoi les réseaux bayésiens sont-ils plus compacts qu'une distribution conjointe complète ?: Une distribution conjointe complète sur n variables binaires nécessite environ 2^n nombres. Un réseau bayésien ne stocke, pour chaque variable, que sa probabilité étant donné ses parents ; ainsi, lorsque chaque variable a peu de parents, le nombre total de paramètres croît approximativement linéairement plutôt qu'exponentiellement par rapport au nombre de variables.
Que nous apprend la d-séparation ?: La d-séparation est un test graphique qui détermine, à partir de la seule structure du réseau, si deux ensembles de variables sont conditionnellement indépendants étant donné un troisième ensemble de variables observées. Elle permet de lire les relations d'indépendance directement sur le graphe sans examiner les valeurs de probabilité réelles.