डेटा वेयरहाउसिंग और ओएलएपी
डेटा वेयरहाउसिंग विश्लेषण के लिए कई स्रोतों से डेटा को क्वेरी-अनुकूलित स्टोर में समेकित करता है, और ऑनलाइन विश्लेषणात्मक प्रसंस्करण (OLAP) बहुआयामी मॉडल और संचालन प्रदान करता है जो विश्लेषकों को उस डेटा को इंटरैक्टिव रूप से एक्सप्लोर करने की सुविधा देता है।
Definition
एक डेटा वेयरहाउस विश्लेषण के लिए कई परिचालन स्रोतों से प्राप्त एकीकृत ऐतिहासिक डेटा का एक समेकित, क्वेरी-अनुकूलित भंडार है; OLAP वह तकनीक है जो ऐसे डेटा को एक बहुआयामी मॉडल में व्यवस्थित करती है और तेज़ एग्रीगेट क्वेरीज़ और इंटरैक्टिव अन्वेषण का समर्थन करती है।
Scope
यह विषय डेटा प्रबंधन के विश्लेषणात्मक पक्ष को शामिल करता है: एक एकीकृत, विषय-उन्मुख स्टोर के रूप में डेटा वेयरहाउस जो परिचालन प्रणालियों से अलग है; इसे पॉप्युलेट करने वाली एक्सट्रैक्ट-ट्रांसफॉर्म-लोड (ETL) पाइपलाइन; तथ्यों और आयामों के स्टार और स्नोफ्लेक स्कीमा के साथ आयामी मॉडलिंग; बहुआयामी डेटा क्यूब और ओएलएपी संचालन (रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस, पिवट); और विश्लेषणात्मक (OLAP) और लेनदेन संबंधी (OLTP) कार्यभार के बीच अंतर। इसमें लेनदेन संबंधी समवर्ती नियंत्रण और सामान्य NoSQL स्टोर शामिल नहीं हैं, जो आसन्न विषय हैं।
Core questions
- एक डेटा वेयरहाउस एक परिचालन (OLTP) डेटाबेस से कैसे भिन्न होता है?
- आयामी मॉडलिंग क्या है, और स्टार और स्नोफ्लेक स्कीमा तथ्यों और आयामों को कैसे व्यवस्थित करते हैं?
- डेटा क्यूब ग्रुप-बाय को कैसे सामान्यीकृत करता है और बहुआयामी विश्लेषण का समर्थन कैसे करता है?
- ओएलएपी संचालन रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस और पिवट क्या करते हैं?
- वेयरहाउस डेटा को एकीकृत और लोड करने के लिए ईटीएल प्रक्रिया का उपयोग कैसे किया जाता है?
Key concepts
- डेटा वेयरहाउस
- एक्सट्रैक्ट-ट्रांसफॉर्म-लोड (ETL)
- स्टार और स्नोफ्लेक स्कीमा
- तथ्य और आयाम तालिकाएँ
- डेटा क्यूब
- रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस, पिवट
- भौतिकीकृत दृश्य
- ओएलएपी बनाम ओएलटीपी
Key theories
- आयामी मॉडलिंग
- वेयरहाउस को आमतौर पर स्टार और स्नोफ्लेक स्कीमा के साथ मॉडल किया जाता है जिसमें मापों की एक केंद्रीय तथ्य तालिका आसपास की आयाम तालिकाओं (समय, उत्पाद, स्थान) को संदर्भित करती है, जो विश्लेषकों द्वारा चलाए जाने वाले एग्रीगेट, रीड-हेवी क्वेरीज़ के लिए अनुकूलित होती है।
- डेटा क्यूब और ओएलएपी संचालन
- डेटा-क्यूब ऑपरेटर आयामों के सभी संयोजनों पर एग्रीगेट की गणना करने के लिए ग्रुप-बाय को सामान्यीकृत करता है, जो इंटरैक्टिव बहुआयामी विश्लेषण के लिए रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस और पिवट का समर्थन करता है।
- ओएलएपी को ओएलटीपी से अलग करना
- विश्लेषणात्मक कार्यभार ऐतिहासिक डेटा की बड़ी मात्रा को स्कैन और एकत्रित करते हैं, जो छोटे लेनदेन संबंधी अपडेट से मौलिक रूप से भिन्न होता है, जो परिचालन प्रणालियों से ईटीएल द्वारा पॉप्युलेट किए गए एक अलग, एकीकृत, रीड-अनुकूलित वेयरहाउस को प्रेरित करता है।
Clinical relevance
डेटा वेयरहाउसिंग और ओएलएपी व्यावसायिक बुद्धिमत्ता की नींव हैं: संगठन परिचालन डेटा को वेयरहाउस में समेकित करते हैं और समय, क्षेत्र और उत्पाद जैसे आयामों में बिक्री, वित्त और संचालन का विश्लेषण करने के लिए ओएलएपी का उपयोग करते हैं, जिससे ये प्रौद्योगिकियां डेटा-संचालित निर्णय लेने के लिए केंद्रीय बन जाती हैं।
History
डेटा वेयरहाउसिंग 1990 के दशक की शुरुआत में उभरा जब संगठनों ने परिचालन डेटाबेस से विश्लेषणात्मक क्वेरी को अलग किया; किम्बल के आयामी-मॉडलिंग दृष्टिकोण और इनमोन के एंटरप्राइज़-वेयरहाउस दृष्टिकोण ने इस क्षेत्र को आकार दिया। डेटा-क्यूब ऑपरेटर (ग्रे एट अल., 1997) ने बहुआयामी एकत्रीकरण को औपचारिक रूप दिया, और चौधरी और दयाल के 1997 के अवलोकन ने वेयरहाउसिंग और ओएलएपी तकनीक को समेकित किया जो आधुनिक एनालिटिक्स प्लेटफॉर्म का आधार है।
Key figures
- Surajit Chaudhuri
- Umeshwar Dayal
- Jim Gray
- Ralph Kimball
Related topics
Seminal works
- chaudhuri1997
- gray1997
- kimball2013
Frequently asked questions
- ओएलएपी और ओएलटीपी में क्या अंतर है?
- ओएलटीपी (ऑनलाइन लेनदेन प्रसंस्करण) कई छोटे रीड-राइट लेनदेन को संभालता है, जैसे ऑर्डर देना, जिसमें स्थिरता और तेज़ अपडेट पर जोर दिया जाता है। ओएलएपी (ऑनलाइन विश्लेषणात्मक प्रसंस्करण) जटिल रीड-मोस्टली क्वेरीज़ को संभालता है जो विश्लेषण के लिए ऐतिहासिक डेटा की बड़ी मात्रा को एकत्रित करती हैं। वेयरहाउस ओएलएपी के लिए डिज़ाइन किए गए हैं और उन्हें उन ओएलटीपी प्रणालियों से अलग रखा जाता है जो उन्हें डेटा प्रदान करती हैं।
- पूरी तरह से सामान्यीकृत डिज़ाइन के बजाय स्टार स्कीमा का उपयोग क्यों करें?
- विश्लेषणात्मक क्वेरीज़ आमतौर पर एक बड़ी तथ्य तालिका को कई आयाम तालिकाओं से जोड़ती हैं और एकत्रित करती हैं। एक स्टार स्कीमा जानबूझकर आयामों को डीनॉर्मलाइज़ करती है ताकि जॉइन को कम किया जा सके और इन एग्रीगेट क्वेरीज़ को तेज़ और सहज बनाया जा सके। सामान्यीकरण द्वारा हटाई जाने वाली अतिरेक यहां स्वीकार्य है क्योंकि वेयरहाउस को थोक में लोड किया जाता है और इसे अपडेट करने की तुलना में कहीं अधिक बार क्वेरी किया जाता है।