आयाम न्यूनीकरण
आयाम न्यूनीकरण में बहुभिन्नरूपी विधियाँ शामिल हैं जो कई सहसंबद्ध चरों को कम संख्या में व्युत्पन्न मात्राओं के साथ सारांशित करती हैं, जिससे यथासंभव अधिक संरचना संरक्षित रहती है और व्याख्या तथा विज़ुअलाइज़ेशन आसान हो जाता है।
Definition
आयाम न्यूनीकरण बहुभिन्नरूपी डेटा का एक निम्न-आयामी प्रतिनिधित्व का निर्माण है जो सूचना के एक चयनित मानदंड को बनाए रखता है, जैसे विचरण, पुनर्निर्माण त्रुटि, युग्मित दूरी, या अंतर-सेट सहसंबंध।
Scope
यह क्षेत्र उन तकनीकों को शामिल करता है जो उच्च-आयामी प्रेक्षणों को निम्न-आयामी स्थान में मैप करती हैं। इसमें विचरण-अधिकतम रैखिक अनुमान (प्रमुख घटक विश्लेषण), साझा सहप्रसरण के लिए अव्यक्त-कारक मॉडल (कारक विश्लेषण), दूरी-संरक्षण एम्बेडिंग (बहुआयामी स्केलिंग), और ऐसी विधियाँ शामिल हैं जो क्रॉस-सहसंबंध को अधिकतम करके दो चर सेटों को संयुक्त रूप से कम करती हैं (विहित सहसंबंध विश्लेषण)। इसमें अनुशासन की नींव बनाने वाले रैखिक और शास्त्रीय दृष्टिकोणों पर जोर दिया गया है; अरेखीय मैनिफोल्ड लर्निंग को एक विस्तार के रूप में माना जाता है।
Sub-topics
Core questions
- सहसंबद्ध मापों के एक बड़े सेट को न्यूनतम सूचना हानि के साथ कुछ असंबंधित व्युत्पन्न चरों द्वारा कैसे प्रतिस्थापित किया जा सकता है?
- विचरण संरक्षण, दूरी संरक्षण, या अव्यक्त-कारक स्पष्टीकरण को न्यूनीकरण मानदंड कब होना चाहिए?
- डेटा को पर्याप्त रूप से प्रस्तुत करने के लिए कितने आयामों की आवश्यकता है?
- घटे हुए प्रतिनिधित्व विज़ुअलाइज़ेशन, डिनोइज़िंग और डाउनस्ट्रीम मॉडलिंग का समर्थन कैसे करते हैं?
Key theories
- विचरण-अधिकतम रैखिक प्रक्षेपण
- प्रमुख मुख्य अक्ष ऑर्थोनॉर्मल दिशाएँ हैं जो उत्तरोत्तर अधिकतम विचरण को कैप्चर करती हैं, जो सहप्रसरण मैट्रिक्स के आइगेनवेक्टरों के बराबर हैं और डेटा के सर्वोत्तम निम्न-रैंक न्यूनतम-वर्ग सन्निकटन के बराबर हैं।
- अव्यक्त सामान्य-कारक मॉडल
- चरों के बीच देखे गए सहसंबंधों को कम संख्या में अनदेखे सामान्य कारकों और चर-विशिष्ट विशिष्टता द्वारा समझाया जाता है, जो सहप्रसरण संरचना को साझा और अद्वितीय भागों में विघटित करता है।
Clinical relevance
आयाम न्यूनीकरण खोजपूर्ण डेटा विश्लेषण, डेटा विज़ुअलाइज़ेशन, सिग्नल डिनोइज़िंग, संपीड़न, और जीनोमिक्स से लेकर अर्थमिति और छवि विश्लेषण तक के क्षेत्रों में प्रतिगमन और वर्गीकरण के लिए सुविधाओं के पूर्व-प्रसंस्करण का आधार है।
History
विचरण-अधिकतम दृष्टिकोण पियर्सन के 1901 के निकटतम फिट की रेखाओं और तलों के ज्यामितीय सूत्रीकरण के साथ उत्पन्न हुआ, और 1933 में हॉटेलिंग द्वारा प्रमुख घटकों की आधुनिक सांख्यिकीय विधि के रूप में विकसित किया गया। कारक विश्लेषण मनोमिति से समानांतर रूप से विकसित हुआ, और दूरी-आधारित स्केलिंग तथा विहित सहसंबंध इसके बाद आए, जो बीसवीं सदी के मध्य के बहुभिन्नरूपी ग्रंथों में पाए जाने वाले आयाम न्यूनीकरण के एकीकृत उपचार में समेकित हुए।
Key figures
- Karl Pearson
- Harold Hotelling
Related topics
Seminal works
- pearson1901
- mardia1979
- johnson2007
Frequently asked questions
- आयाम न्यूनीकरण और चर चयन में क्या अंतर है?
- चर चयन मूल चरों के एक उपसमूह को रखता है, जबकि आयाम न्यूनीकरण आमतौर पर नए व्युत्पन्न चर (जैसे घटक या कारक) का निर्माण करता है जो सभी मूल चरों के संयोजन होते हैं।
- क्या आयाम न्यूनीकरण हमेशा रैखिक होता है?
- नहीं। शास्त्रीय मुख्य विधियाँ रैखिक हैं, लेकिन उन्हीं लक्ष्यों को अरेखीय मैनिफोल्ड-लर्निंग और एम्बेडिंग तकनीकों द्वारा भी प्राप्त किया जाता है; रैखिक विधियाँ मौलिक और व्याख्या योग्य बनी हुई हैं।