ScholarGate
सहायक

डेटा वेयरहाउसिंग और ओएलएपी

डेटा वेयरहाउसिंग विश्लेषण के लिए कई स्रोतों से डेटा को क्वेरी-अनुकूलित स्टोर में समेकित करता है, और ऑनलाइन विश्लेषणात्मक प्रसंस्करण (OLAP) बहुआयामी मॉडल और संचालन प्रदान करता है जो विश्लेषकों को उस डेटा को इंटरैक्टिव रूप से एक्सप्लोर करने की सुविधा देता है।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

एक डेटा वेयरहाउस विश्लेषण के लिए कई परिचालन स्रोतों से प्राप्त एकीकृत ऐतिहासिक डेटा का एक समेकित, क्वेरी-अनुकूलित भंडार है; OLAP वह तकनीक है जो ऐसे डेटा को एक बहुआयामी मॉडल में व्यवस्थित करती है और तेज़ एग्रीगेट क्वेरीज़ और इंटरैक्टिव अन्वेषण का समर्थन करती है।

Scope

यह विषय डेटा प्रबंधन के विश्लेषणात्मक पक्ष को शामिल करता है: एक एकीकृत, विषय-उन्मुख स्टोर के रूप में डेटा वेयरहाउस जो परिचालन प्रणालियों से अलग है; इसे पॉप्युलेट करने वाली एक्सट्रैक्ट-ट्रांसफॉर्म-लोड (ETL) पाइपलाइन; तथ्यों और आयामों के स्टार और स्नोफ्लेक स्कीमा के साथ आयामी मॉडलिंग; बहुआयामी डेटा क्यूब और ओएलएपी संचालन (रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस, पिवट); और विश्लेषणात्मक (OLAP) और लेनदेन संबंधी (OLTP) कार्यभार के बीच अंतर। इसमें लेनदेन संबंधी समवर्ती नियंत्रण और सामान्य NoSQL स्टोर शामिल नहीं हैं, जो आसन्न विषय हैं।

Core questions

  • एक डेटा वेयरहाउस एक परिचालन (OLTP) डेटाबेस से कैसे भिन्न होता है?
  • आयामी मॉडलिंग क्या है, और स्टार और स्नोफ्लेक स्कीमा तथ्यों और आयामों को कैसे व्यवस्थित करते हैं?
  • डेटा क्यूब ग्रुप-बाय को कैसे सामान्यीकृत करता है और बहुआयामी विश्लेषण का समर्थन कैसे करता है?
  • ओएलएपी संचालन रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस और पिवट क्या करते हैं?
  • वेयरहाउस डेटा को एकीकृत और लोड करने के लिए ईटीएल प्रक्रिया का उपयोग कैसे किया जाता है?

Key concepts

  • डेटा वेयरहाउस
  • एक्सट्रैक्ट-ट्रांसफॉर्म-लोड (ETL)
  • स्टार और स्नोफ्लेक स्कीमा
  • तथ्य और आयाम तालिकाएँ
  • डेटा क्यूब
  • रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस, पिवट
  • भौतिकीकृत दृश्य
  • ओएलएपी बनाम ओएलटीपी

Key theories

आयामी मॉडलिंग
वेयरहाउस को आमतौर पर स्टार और स्नोफ्लेक स्कीमा के साथ मॉडल किया जाता है जिसमें मापों की एक केंद्रीय तथ्य तालिका आसपास की आयाम तालिकाओं (समय, उत्पाद, स्थान) को संदर्भित करती है, जो विश्लेषकों द्वारा चलाए जाने वाले एग्रीगेट, रीड-हेवी क्वेरीज़ के लिए अनुकूलित होती है।
डेटा क्यूब और ओएलएपी संचालन
डेटा-क्यूब ऑपरेटर आयामों के सभी संयोजनों पर एग्रीगेट की गणना करने के लिए ग्रुप-बाय को सामान्यीकृत करता है, जो इंटरैक्टिव बहुआयामी विश्लेषण के लिए रोल-अप, ड्रिल-डाउन, स्लाइस, डाइस और पिवट का समर्थन करता है।
ओएलएपी को ओएलटीपी से अलग करना
विश्लेषणात्मक कार्यभार ऐतिहासिक डेटा की बड़ी मात्रा को स्कैन और एकत्रित करते हैं, जो छोटे लेनदेन संबंधी अपडेट से मौलिक रूप से भिन्न होता है, जो परिचालन प्रणालियों से ईटीएल द्वारा पॉप्युलेट किए गए एक अलग, एकीकृत, रीड-अनुकूलित वेयरहाउस को प्रेरित करता है।

Clinical relevance

डेटा वेयरहाउसिंग और ओएलएपी व्यावसायिक बुद्धिमत्ता की नींव हैं: संगठन परिचालन डेटा को वेयरहाउस में समेकित करते हैं और समय, क्षेत्र और उत्पाद जैसे आयामों में बिक्री, वित्त और संचालन का विश्लेषण करने के लिए ओएलएपी का उपयोग करते हैं, जिससे ये प्रौद्योगिकियां डेटा-संचालित निर्णय लेने के लिए केंद्रीय बन जाती हैं।

History

डेटा वेयरहाउसिंग 1990 के दशक की शुरुआत में उभरा जब संगठनों ने परिचालन डेटाबेस से विश्लेषणात्मक क्वेरी को अलग किया; किम्बल के आयामी-मॉडलिंग दृष्टिकोण और इनमोन के एंटरप्राइज़-वेयरहाउस दृष्टिकोण ने इस क्षेत्र को आकार दिया। डेटा-क्यूब ऑपरेटर (ग्रे एट अल., 1997) ने बहुआयामी एकत्रीकरण को औपचारिक रूप दिया, और चौधरी और दयाल के 1997 के अवलोकन ने वेयरहाउसिंग और ओएलएपी तकनीक को समेकित किया जो आधुनिक एनालिटिक्स प्लेटफॉर्म का आधार है।

Key figures

  • Surajit Chaudhuri
  • Umeshwar Dayal
  • Jim Gray
  • Ralph Kimball

Related topics

Seminal works

  • chaudhuri1997
  • gray1997
  • kimball2013

Frequently asked questions

ओएलएपी और ओएलटीपी में क्या अंतर है?
ओएलटीपी (ऑनलाइन लेनदेन प्रसंस्करण) कई छोटे रीड-राइट लेनदेन को संभालता है, जैसे ऑर्डर देना, जिसमें स्थिरता और तेज़ अपडेट पर जोर दिया जाता है। ओएलएपी (ऑनलाइन विश्लेषणात्मक प्रसंस्करण) जटिल रीड-मोस्टली क्वेरीज़ को संभालता है जो विश्लेषण के लिए ऐतिहासिक डेटा की बड़ी मात्रा को एकत्रित करती हैं। वेयरहाउस ओएलएपी के लिए डिज़ाइन किए गए हैं और उन्हें उन ओएलटीपी प्रणालियों से अलग रखा जाता है जो उन्हें डेटा प्रदान करती हैं।
पूरी तरह से सामान्यीकृत डिज़ाइन के बजाय स्टार स्कीमा का उपयोग क्यों करें?
विश्लेषणात्मक क्वेरीज़ आमतौर पर एक बड़ी तथ्य तालिका को कई आयाम तालिकाओं से जोड़ती हैं और एकत्रित करती हैं। एक स्टार स्कीमा जानबूझकर आयामों को डीनॉर्मलाइज़ करती है ताकि जॉइन को कम किया जा सके और इन एग्रीगेट क्वेरीज़ को तेज़ और सहज बनाया जा सके। सामान्यीकरण द्वारा हटाई जाने वाली अतिरेक यहां स्वीकार्य है क्योंकि वेयरहाउस को थोक में लोड किया जाता है और इसे अपडेट करने की तुलना में कहीं अधिक बार क्वेरी किया जाता है।

Methods for this concept

Related concepts