पदानुक्रमित समूह विश्लेषण
पदानुक्रमित समूह विश्लेषण समूहों के एक नेस्टेड अनुक्रम का निर्माण करता है, जिसे डेंड्रोग्राम के रूप में देखा जाता है, जो एक लिंकेज मानदंड के अनुसार समूहों को क्रमिक रूप से विलय या विभाजित करके किया जाता है।
Definition
पदानुक्रमित समूह विश्लेषण एक क्लस्टरिंग दृष्टिकोण है जो नेस्टेड विभाजनों का एक ट्री उत्पन्न करता है, जो चुने हुए अंतर-समूह दूरी के अनुसार सबसे समान समूहों को पुनरावृत्त रूप से संयोजित करके, या सबसे कम सुसंगत वाले को विभाजित करके किया जाता है।
Scope
यह विषय एग्लोमेरेटिव (नीचे से ऊपर) और डिवीसिव (ऊपर से नीचे) पदानुक्रमित क्लस्टरिंग, सामान्य लिंकेज नियम जैसे सिंगल, कम्प्लीट, एवरेज और वार्ड का न्यूनतम-विचरण लिंकेज, डेंड्रोग्राम का निर्माण और व्याख्या, और एक सपाट विभाजन प्राप्त करने के लिए पेड़ को काटना शामिल करता है।
Core questions
- जोड़ीदार असमानताओं से क्लस्टरिंग के एक नेस्टेड परिवार का निर्माण कैसे किया जा सकता है?
- विभिन्न लिंकेज नियम परिणामी समूहों को कैसे आकार देते हैं?
- डेंड्रोग्राम को कैसे पढ़ा जाता है और इसे कहाँ काटा जाना चाहिए?
- एकल सपाट विभाजन की तुलना में पदानुक्रमित संरचना कब अधिक जानकारीपूर्ण होती है?
Key theories
- लिंकेज-परिभाषित विलय
- एग्लोमेरेटिव क्लस्टरिंग लिंकेज परिभाषा के तहत सबसे करीब के दो समूहों को बार-बार विलय करती है; सिंगल, कम्प्लीट, एवरेज और वार्ड लिंकेज अंतर-समूह दूरी की विभिन्न धारणाओं को एन्कोड करते हैं और विशिष्ट रूप से भिन्न समूह आकार उत्पन्न करते हैं।
- डेंड्रोग्राम प्रतिनिधित्व
- विलय के अनुक्रम को एक डेंड्रोग्राम के रूप में एन्कोड किया जाता है जिसकी विलय ऊँचाई असमानता को रिकॉर्ड करती है, जिससे चुनी हुई ऊँचाई पर पेड़ को काटकर किसी भी संख्या में समूह प्राप्त किए जा सकते हैं।
Clinical relevance
पदानुक्रमित क्लस्टरिंग का व्यापक रूप से उपयोग किया जाता है जहाँ एक नेस्टेड समूहीकरण स्वाभाविक या सूचनात्मक होता है, जैसे वर्गीकरण का निर्माण, जीन-अभिव्यक्ति हीटमैप्स का आयोजन, और दस्तावेज़ या जीव समानता की खोज।
History
पदानुक्रमित समूहीकरण विधियों को 1960 के दशक की शुरुआत में औपचारिक रूप दिया गया था, जिसमें वार्ड का न्यूनतम-विचरण मानदंड भी शामिल था, और जैसे-जैसे कंप्यूटिंग ने डेंड्रोग्राम निर्माण को नियमित बना दिया, वे संख्यात्मक वर्गीकरण और अन्वेषी डेटा विश्लेषण के मुख्य आधार बन गए।
Debates
- लिंकेज का चुनाव
- सिंगल लिंकेज समूहों को एक साथ जोड़ सकता है जबकि कम्प्लीट लिंकेज कॉम्पैक्ट समूह बनाने की प्रवृत्ति रखता है, और वार्ड की विधि समान आकार के गोलाकार समूहों का पक्ष लेती है, इसलिए लिंकेज का चुनाव परिणामों को दृढ़ता से आकार देता है और शायद ही कभी विशिष्ट रूप से सही होता है।
Key figures
- Joe Ward
- Peter Rousseeuw
Related topics
Seminal works
- everitt2011
- kaufman1990
- wardjr1963
Frequently asked questions
- एग्लोमेरेटिव और डिवीसिव क्लस्टरिंग में क्या अंतर है?
- एग्लोमेरेटिव क्लस्टरिंग प्रत्येक वस्तु को अपने स्वयं के समूह के रूप में शुरू करती है और ऊपर की ओर विलय करती है, जबकि डिवीसिव क्लस्टरिंग एक समूह से शुरू होती है और नीचे की ओर विभाजित होती है; व्यवहार में एग्लोमेरेटिव विधियाँ कहीं अधिक सामान्य हैं।
- मैं डेंड्रोग्राम से समूहों की संख्या कैसे चुनूँ?
- पेड़ को एक चुनी हुई ऊँचाई पर काटकर, अक्सर जहाँ विलय की ऊँचाई तेजी से बढ़ती है, जो उन समूहों को संयोजित करने के अनुरूप होता है जो नीचे विलय किए गए लोगों की तुलना में बहुत कम समान होते हैं।