प्रायिकतामूलक अनुमान
प्रायिकतामूलक अनुमान, प्रायिकतामूलक मॉडल में देखे गए साक्ष्य के आधार पर क्वेरी चरों की प्रायिकता की गणना है, जो बायेसियन और मार्कोव नेटवर्कों पर केंद्रीय तर्क कार्य है।
Definition
प्रायिकतामूलक अनुमान एक पश्च वितरण (posterior distribution) की गणना करता है, जैसे कि एक या अधिक क्वेरी चरों की प्रायिकता जो देखे गए साक्ष्य पर आधारित होती है, एक निर्दिष्ट प्रायिकतामूलक मॉडल से, या तो सटीक रूप से या सन्निकटन द्वारा।
Scope
यह विषय उन एल्गोरिदम को शामिल करता है जो ग्राफिकल मॉडल में प्रायिकतामूलक प्रश्नों का उत्तर देते हैं: सटीक विधियाँ जैसे चर विलोपन (variable elimination), ट्री में बिलीफ प्रोपेगेशन (belief propagation), और जंक्शन-ट्री (क्लिक-ट्री) एल्गोरिथम; और अनुमानित विधियाँ जैसे लूप्पी बिलीफ प्रोपेगेशन (loopy belief propagation) और मोंटे कार्लो सैंपलिंग (Monte Carlo sampling) (रिजेक्शन सैंपलिंग (rejection sampling), लाइकलीहुड वेटिंग (likelihood weighting), और मार्कोव चेन मोंटे कार्लो (Markov chain Monte Carlo))। यह अनुमान की कम्प्यूटेशनल कठिनाई और सटीकता तथा स्केलेबिलिटी (scalability) के बीच के व्यापार-बंदों को संबोधित करता है। मॉडलों की संरचना स्वयं बायेसियन नेटवर्कों के अंतर्गत आती है।
Core questions
- पूर्ण वितरण को सूचीबद्ध किए बिना एक संयुक्त मॉडल से सशर्त या सीमांत प्रायिकता की गणना कैसे की जाती है?
- चर विलोपन (variable elimination) सटीक उत्तरों की कुशलता से गणना करने के लिए गुणनखंडन (factorization) का लाभ कैसे उठाता है?
- सटीक अनुमान कब असाध्य (intractable) होता है, और इसके बजाय किन अनुमानित विधियों का उपयोग किया जाता है?
- सैंपलिंग-आधारित विधियाँ पश्च प्रायिकताओं का अनुमान कैसे लगाती हैं?
Key concepts
- सीमांत और सशर्त प्रश्न
- चर विलोपन
- बिलीफ प्रोपेगेशन (संदेश पासिंग)
- जंक्शन ट्री और ट्रीविड्थ
- लूप्पी बिलीफ प्रोपेगेशन
- रिजेक्शन सैंपलिंग और लाइकलीहुड वेटिंग
- मार्कोव चेन मोंटे कार्लो
- सटीक बनाम अनुमानित अनुमान
Key theories
- बिलीफ प्रोपेगेशन
- ट्री-संरचित नेटवर्कों में, पड़ोसी नोड्स के बीच स्थानीय संदेशों को पारित करके सटीक पश्च की गणना की जा सकती है; पर्ल का बिलीफ प्रोपेगेशन इस वितरित गणना को निष्पादित करता है और, लूप्पी ग्राफों पर लागू होने पर, एक व्यापक रूप से उपयोग की जाने वाली अनुमानित अनुमान विधि प्रदान करता है।
- जंक्शन-ट्री (क्लिक-ट्री) अनुमान
- सामान्य नेटवर्कों में सटीक अनुमान को चरों को क्लिक्स के एक ट्री में समूहित करके और उस पर संदेशों को प्रसारित करके व्यवस्थित किया जा सकता है, जिससे सबसे बड़े क्लिक (ट्रीविड्थ) में केवल घातीय समय में सही उत्तर मिलते हैं।
- सैंपलिंग द्वारा अनुमानित अनुमान
- जब सटीक अनुमान अव्यावहारिक होता है, तो मोंटे कार्लो विधियाँ जैसे लाइकलीहुड वेटिंग और मार्कोव चेन मोंटे कार्लो, पश्च प्रायिकताओं का अनुमान लगाने के लिए साक्ष्य के अनुरूप नमूने खींचते हैं, स्केलेबिलिटी के लिए गारंटीकृत सटीकता का व्यापार करते हैं।
Clinical relevance
अनुमान एल्गोरिदम ही प्रायिकतामूलक मॉडलों को उपयोगी बनाते हैं: वे निदान और निर्णय-समर्थन प्रणालियों, त्रुटि-सुधार कोड (बिलीफ प्रोपेगेशन के माध्यम से), कंप्यूटर विजन, वाक् पहचान और बायोइन्फॉर्मेटिक्स को शक्ति प्रदान करते हैं, देखे गए डेटा के आधार पर छिपे हुए चरों की प्रायिकताओं की गणना करके।
History
पर्ल के बिलीफ प्रोपेगेशन (1980 के दशक) ने ट्री नेटवर्कों के लिए सटीक अनुमान प्रदान किया, और लॉरिट्जन और स्पीगेलहाल्टर की 1988 की जंक्शन-ट्री विधि ने क्लिक्स (cliques) पर स्थानीय गणनाओं के माध्यम से सामान्य नेटवर्कों तक सटीक अनुमान का विस्तार किया। यह पहचान कि सामान्य रूप से सटीक अनुमान NP-कठिन है, ने सैंपलिंग और वेरिएशनल सन्निकटन (variational approximations) पर व्यापक कार्य को प्रेरित किया।
Key figures
- Judea Pearl
- Steffen L. Lauritzen
- David J. Spiegelhalter
- Daphne Koller
Related topics
Seminal works
- pearl1986
- lauritzen1988
Frequently asked questions
- क्या प्रायिकतामूलक अनुमान हमेशा साध्य (tractable) होता है?
- नहीं। सामान्य बायेसियन नेटवर्कों में सटीक अनुमान NP-कठिन होता है, और इसकी लागत नेटवर्क की ट्रीविड्थ के साथ बढ़ती है। ऐसे नेटवर्कों के लिए जो ट्री हैं या जिनकी ट्रीविड्थ कम है, सटीक अनुमान कुशल होता है; अन्यथा सैंपलिंग या लूप्पी बिलीफ प्रोपेगेशन जैसी अनुमानित विधियों का उपयोग किया जाता है।
- सटीक और अनुमानित अनुमान में क्या अंतर है?
- सटीक अनुमान, जैसे चर विलोपन या जंक्शन-ट्री एल्गोरिथम, वास्तविक पश्च प्रायिकताओं की गणना करता है। अनुमानित अनुमान, जैसे मोंटे कार्लो सैंपलिंग या लूप्पी बिलीफ प्रोपेगेशन, उनका अनुमान लगाता है, जो तब आवश्यक होता है जब एक बड़े या घनी रूप से जुड़े मॉडल के लिए सटीक गणना बहुत महंगी होती है।