Réseaux bayésiens
Un réseau bayésien est un graphe orienté acyclique dont les nœuds représentent des variables aléatoires et dont les arêtes encodent des dépendances conditionnelles, offrant ainsi une représentation compacte d'une distribution de probabilité conjointe.
Definition
Un réseau bayésien est un modèle graphique probabiliste composé d'un graphe orienté acyclique sur des variables aléatoires, associé à une distribution de probabilité conditionnelle pour chaque variable étant donné ses parents, l'ensemble définissant conjointement une distribution complète sur toutes les variables.
Scope
Ce sujet aborde la structure et la sémantique des réseaux bayésiens (ou réseaux de croyances) : le graphe orienté acyclique, les distributions de probabilité conditionnelles locales, la factorisation de la distribution conjointe par la règle de la chaîne, et les relations d'indépendance qu'ils encodent (la condition de Markov et la d-séparation). Il explique comment un réseau est interprété comme un modèle d'indépendance conditionnelle et comment il stocke de manière compacte une distribution de taille exponentielle. Les algorithmes d'inférence sur ces réseaux sont traités dans le sujet connexe de l'inférence probabiliste, et l'apprentissage de leur structure ou de leurs paramètres à partir de données relève du sous-domaine de l'apprentissage automatique.
Core questions
- Comment un graphe orienté acyclique, combiné à des distributions conditionnelles locales, spécifie-t-il une distribution conjointe complète ?
- Quelles relations d'indépendance conditionnelle la structure du réseau encode-t-elle ?
- Comment la d-séparation détermine-t-elle si deux variables sont indépendantes étant donné des preuves observées ?
- Pourquoi la représentation factorisée nécessite-t-elle beaucoup moins de nombres que la distribution conjointe complète ?
Key concepts
- graphe orienté acyclique
- tables de probabilité conditionnelle
- factorisation par la règle de la chaîne
- condition de Markov
- d-séparation
- parents et descendants
- distribution conjointe compacte
- modèle graphique
Key theories
- Factorisation via la condition de Markov
- Un réseau bayésien affirme que chaque variable est conditionnellement indépendante de ses non-descendants étant donné ses parents, de sorte que la distribution conjointe se factorise en le produit de la distribution conditionnelle de chaque variable étant donné ses parents, ce qui entraîne une économie considérable de paramètres.
- d-séparation et indépendance
- Le critère graphique de la d-séparation permet de lire les indépendances conditionnelles directement à partir de la structure du réseau, caractérisant précisément quelles déclarations d'indépendance sont impliquées par le graphe, indépendamment des paramètres numériques.
- Les réseaux de croyances comme inférence plausible
- Le cadre des réseaux de croyances de Pearl a montré comment les probabilités conditionnelles locales et la propagation de messages permettent une inférence plausible cohérente, établissant les modèles graphiques orientés comme un outil solide et pratique pour représenter des connaissances incertaines.
Clinical relevance
Les réseaux bayésiens sont utilisés pour le diagnostic médical, l'analyse des défaillances et des risques, la fusion de capteurs, la modélisation de réseaux de régulation génique et d'autres réseaux biologiques, ainsi que pour l'aide à la décision, car ils rendent explicites les dépendances probabilistes complexes et permettent de propager des preuves pour actualiser les croyances concernant des variables non observées.
History
Les réseaux bayésiens ont été développés par Judea Pearl dans les années 1980 comme un formalisme graphique pour l'inférence plausible, exposé en détail dans son livre de 1988. Ils ont unifié des idées probabilistes et graphiques antérieures, sont devenus le modèle graphique orienté canonique, et ont ensuite été étendus et systématisés dans la littérature des modèles graphiques probabilistes.
Key figures
- Judea Pearl
- Daphne Koller
- Nir Friedman
- David Heckerman
Related topics
Seminal works
- pearl1986
- pearl1988
Frequently asked questions
- Pourquoi les réseaux bayésiens sont-ils plus compacts qu'une distribution conjointe complète ?
- Une distribution conjointe complète sur n variables binaires nécessite environ 2^n nombres. Un réseau bayésien ne stocke, pour chaque variable, que sa probabilité étant donné ses parents ; ainsi, lorsque chaque variable a peu de parents, le nombre total de paramètres croît approximativement linéairement plutôt qu'exponentiellement par rapport au nombre de variables.
- Que nous apprend la d-séparation ?
- La d-séparation est un test graphique qui détermine, à partir de la seule structure du réseau, si deux ensembles de variables sont conditionnellement indépendants étant donné un troisième ensemble de variables observées. Elle permet de lire les relations d'indépendance directement sur le graphe sans examiner les valeurs de probabilité réelles.