अव्यक्त चर और मिश्रण मॉडल
अव्यक्त-चर और मिश्रण मॉडल छिपे हुए चरों के माध्यम से प्रेक्षित डेटा की व्याख्या करते हैं, छिपी हुई संरचना का अनुमान लगाकर और मापदंडों को अद्यतन करके उन्हें फिट करते हैं।
Definition
एक अव्यक्त-चर मॉडल प्रत्येक अवलोकन को अप्रत्यक्ष चरों की सहायता से उत्पन्न के रूप में प्रस्तुत करता है, जैसे कि किस मिश्रण घटक ने एक बिंदु का उत्पादन किया; प्रत्याशा-अधिकतमीकरण एल्गोरिथम अव्यक्त चरों के अपेक्षित मानों की गणना करने और परिणामी अपेक्षित संभावना को अधिकतम करने के बीच पुनरावृति करके मापदंडों का अनुमान लगाता है।
Scope
यह विषय अप्रत्यक्ष चरों वाले संभाव्य मॉडल को शामिल करता है: परिमित मिश्रण मॉडल जैसे गॉसियन मिश्रण, अनुक्रमों के लिए छिपे हुए मार्कोव मॉडल, और प्रत्याशा-अधिकतमीकरण एल्गोरिथम जो संभावना को अधिकतम करके उन्हें फिट करता है। इसमें सॉफ्ट क्लस्टरिंग, घनत्व अनुमान, और डेटा संभावना को सीमित करने के रूप में ईएम के भिन्नता संबंधी दृष्टिकोण से संबंध भी शामिल है।
Core questions
- छिपे हुए चर प्रेक्षित डेटा की व्याख्या कैसे करते हैं?
- प्रत्याशा-अधिकतमीकरण एल्गोरिथम प्रत्येक चरण में संभावना को कैसे बढ़ाता है?
- गॉसियन मिश्रण सॉफ्ट क्लस्टरिंग और घनत्व अनुमान कैसे करते हैं?
- ईएम केवल एक स्थानीय इष्टतम पर ही क्यों अभिसरण कर सकता है?
Key theories
- प्रत्याशा-अधिकतमीकरण एल्गोरिथम
- ईएम एक प्रत्याशा चरण को वैकल्पिक करता है जो अव्यक्त चरों पर वितरण का अनुमान लगाता है और एक अधिकतमीकरण चरण जो मापदंडों को अद्यतन करता है, जो सिद्ध रूप से डेटा संभावना को कभी कम नहीं करता है और एक स्थिर बिंदु पर अभिसरण करता है।
- गॉसियन मिश्रण मॉडल
- गॉसियन घटकों के भारित योग के रूप में डेटा को मॉडल करना लचीले घनत्व अनुमान और सॉफ्ट क्लस्टर असाइनमेंट उत्पन्न करता है, जिसमें प्रत्येक बिंदु को प्रत्येक घटक से संबंधित होने की संभावना दी जाती है।
- निचली-सीमा अधिकतमीकरण के रूप में ईएम
- ईएम को लॉग-संभावना पर एक भिन्नता संबंधी निचली सीमा को अधिकतम करने के रूप में देखा जा सकता है, एक ऐसा परिप्रेक्ष्य जो अधिक जटिल अव्यक्त-चर मॉडल में अनुमानित अनुमान के लिए सामान्यीकृत होता है।
Clinical relevance
अव्यक्त-चर मॉडल सॉफ्ट क्लस्टरिंग, घनत्व अनुमान, गुम-डेटा आरोपण, और भाषण और बायोइन्फॉर्मेटिक्स में छिपे हुए मार्कोव मॉडल के साथ अनुक्रम मॉडलिंग को आधार बनाते हैं; प्रत्याशा-अधिकतमीकरण एल्गोरिथम जिस पर वे निर्भर करते हैं, वह सांख्यिकी और मशीन लर्निंग में सबसे व्यापक रूप से उपयोग की जाने वाली अनुकूलन प्रक्रियाओं में से एक है।
History
प्रत्याशा-अधिकतमीकरण विचार के विशेष मामले आनुवंशिकी और अपूर्ण-डेटा समस्याओं में डेम्पस्टर, लेयर्ड और रुबिन द्वारा 1977 में सामान्य सूत्रीकरण देने से पहले सामने आए। गॉसियन मिश्रण और छिपे हुए मार्कोव मॉडल मानक अव्यक्त-चर उपकरण बन गए, और ईएम की भिन्नता संबंधी पुनर्व्याख्या ने बाद में इसे अधिक जटिल अव्यक्त-चर मॉडल में आधुनिक अनुमान-अनुमान विधियों से जोड़ा।
Key figures
- Arthur Dempster
- Nan Laird
- Donald Rubin
Related topics
Seminal works
- dempster1977
- bishop2006
- murphy2012
Frequently asked questions
- अव्यक्त चर क्या है?
- एक अव्यक्त चर एक अप्रत्यक्ष मात्रा है जिसे प्रेक्षित डेटा की व्याख्या करने के लिए एक मॉडल में शामिल किया जाता है, जैसे कि किस छिपे हुए क्लस्टर ने एक डेटा बिंदु उत्पन्न किया। मॉडल इन छिपे हुए चरों को सीधे मापने के बजाय उन पर एक वितरण का अनुमान लगाता है।
- ईएम एल्गोरिथम क्यों अटक सकता है?
- ईएम प्रत्येक चरण में संभावना को बढ़ाता है लेकिन केवल एक स्थानीय अधिकतम या स्थिर बिंदु पर अभिसरण की गारंटी देता है। विभिन्न प्रारंभिककरण विभिन्न समाधानों को जन्म दे सकते हैं, इसलिए व्यवसायी अक्सर इसे विभिन्न प्रारंभिक मानों से कई बार चलाते हैं।