वितरित और समानांतर डेटाबेस
वितरित और समानांतर डेटाबेस डेटा और क्वेरी प्रोसेसिंग को कई मशीनों में फैलाते हैं ताकि डेटा के सुसंगत दृश्य को बनाए रखते हुए स्केलेबिलिटी, उपलब्धता और उच्च प्रदर्शन प्राप्त किया जा सके।
Definition
एक वितरित डेटाबेस कई नेटवर्क वाली साइटों में डेटा संग्रहीत करता है जो उपयोगकर्ताओं को एक एकल डेटाबेस के रूप में दिखाई देती हैं, और एक समानांतर डेटाबेस उच्च थ्रूपुट और कम विलंबता के लिए डेटाबेस संचालन को समवर्ती रूप से निष्पादित करने के लिए कई प्रोसेसर और डिस्क (आमतौर पर साझा-कुछ भी नहीं) का उपयोग करता है।
Scope
यह क्षेत्र कई नोड्स में डेटा के प्रबंधन को कवर करता है: डेटा को कैसे विभाजित (खंडित) और प्रतिकृत किया जाता है; विभाजन और वितरित साइटों में क्वेरीज़ को समानांतर में कैसे संसाधित किया जाता है; और लेनदेन परमाणु रूप से कैसे प्रतिबद्ध होते हैं और प्रतिकृतियां प्रतिबद्धता और आम सहमति प्रोटोकॉल के माध्यम से सुसंगत रहती हैं। यह साझा-कुछ भी नहीं समानांतर डेटाबेस और भौगोलिक रूप से वितरित डेटाबेस के बीच वास्तुशिल्प अंतर को मानता है। यह सामान्य वितरित-कंप्यूटिंग विषयों का डेटाबेस-विशिष्ट पूरक है, जिसे यह उद्धृत करता है लेकिन दोहराता नहीं है; यह डेटाबेस उपयोग से परे सामान्य-उद्देश्य आम सहमति और वितरित-प्रणाली सिद्धांत को बाहर करता है।
Sub-topics
Core questions
- डेटा को नोड्स में कैसे विभाजित और प्रतिकृत किया जाता है, और क्यों?
- क्वेरीज़ को विभाजन और साइटों में समानांतर में कैसे निष्पादित किया जाता है?
- जब कोई लेनदेन कई नोड्स में फैला होता है तो उसे परमाणु रूप से कैसे प्रतिबद्ध किया जाता है?
- विफलताओं की उपस्थिति में प्रतिकृतियां कैसे सुसंगत रहती हैं?
- समानांतर (साझा-कुछ भी नहीं) और भौगोलिक रूप से वितरित डिज़ाइन कैसे भिन्न होते हैं?
Key concepts
- क्षैतिज और ऊर्ध्वाधर विखंडन
- प्रतिकृति
- साझा-कुछ भी नहीं वास्तुकला
- विभाजित और पाइपलाइन समानांतरता
- वितरित क्वेरी प्रोसेसिंग
- दो-चरण प्रतिबद्धता
- आम सहमति और प्रतिकृति संगति
- स्पीडअप और स्केलअप
Key theories
- डेटा विभाजन और प्रतिकृति
- स्केलेबिलिटी के लिए तालिकाओं को क्षैतिज या ऊर्ध्वाधर रूप से खंडित और नोड्स में वितरित किया जाता है, और उपलब्धता और पढ़ने के प्रदर्शन के लिए प्रतियां प्रतिकृत की जाती हैं; प्लेसमेंट रणनीति लोड संतुलन और दोष सहिष्णुता निर्धारित करती है।
- समानांतर क्वेरी प्रोसेसिंग
- साझा-कुछ भी नहीं समानांतर डेटाबेस डेटा को विभाजित करके और नोड्स में समानांतर में स्कैन और जॉइन जैसे ऑपरेटरों को निष्पादित करके लगभग रैखिक स्पीडअप और स्केलअप प्राप्त करते हैं, विभाजित और पाइपलाइन समानांतरता का लाभ उठाते हुए।
- वितरित प्रतिबद्धता और प्रतिकृति संगति
- दो-चरण प्रतिबद्धता जैसे परमाणु प्रतिबद्धता प्रोटोकॉल साइटों में सभी-या-कुछ भी परिणामों को सुनिश्चित करते हैं, और आम सहमति और प्रतिकृति प्रोटोकॉल नोड और नेटवर्क विफलताओं के बावजूद प्रतिकृतियों को सुसंगत रखते हैं।
Clinical relevance
वितरित और समानांतर डेटाबेस ही हैं जो डेटा सिस्टम को इंटरनेट वर्कलोड तक स्केल करने की अनुमति देते हैं: समानांतर डेटा वेयरहाउस पेटाबाइट्स पर विश्लेषण चलाते हैं, भौगोलिक रूप से वितरित डेटाबेस वैश्विक सेवाओं को उपलब्ध और कम विलंबता पर रखते हैं, और यहां विभाजन, प्रतिकृति और प्रतिबद्धता तकनीकें लगभग हर बड़े पैमाने के डेटा प्लेटफॉर्म का आधार हैं।
History
वितरित डेटाबेस अनुसंधान 1970 के दशक के अंत में SDD-1 और वितरित इंग्रेस जैसे सिस्टम के साथ शुरू हुआ। 1980 के दशक में साझा-कुछ भी नहीं समानांतर डेटाबेस (गामा, टेराडाटा) देखे गए, जिनके बारे में डेविट और ग्रे ने 1992 में तर्क दिया था कि वे उच्च-प्रदर्शन डेटा प्रबंधन का भविष्य थे। इंटरनेट-स्केल की मांगों ने बाद में विभाजित, प्रतिकृत प्रणालियों को प्रेरित किया जो आधुनिक क्लाउड डेटा प्लेटफॉर्म को परिभाषित करते हैं।
Key figures
- M. Tamer Özsu
- Patrick Valduriez
- David DeWitt
- Jim Gray
Related topics
Seminal works
- ozsu2011
- dewitt1992
- silberschatz2019
Frequently asked questions
- वितरित डेटाबेस और समानांतर डेटाबेस में क्या अंतर है?
- एक समानांतर डेटाबेस क्वेरीज़ को तेज़ी से चलाने के लिए कई कसकर युग्मित प्रोसेसर और डिस्क का उपयोग करता है, आमतौर पर एक तेज़ इंटरकनेक्ट (अक्सर एक साझा-कुछ भी नहीं क्लस्टर) के साथ एक स्थान पर। एक वितरित डेटाबेस उपलब्धता और स्थानीयता के लिए डेटा को अलग-अलग, अक्सर भौगोलिक रूप से बिखरी हुई साइटों में फैलाता है। यह रेखा धुंधली हो जाती है, लेकिन समानांतर डेटाबेस प्रदर्शन पर जोर देते हैं और वितरित डेटाबेस वितरण और स्वायत्तता पर जोर देते हैं।
- साझा-कुछ भी नहीं प्रमुख समानांतर वास्तुकला क्यों है?
- साझा-कुछ भी नहीं डिज़ाइन में प्रत्येक नोड का अपना सीपीयू, मेमोरी और डिस्क होता है, इसलिए नोड्स जोड़ने पर कोई केंद्रीय संसाधन बॉटलनेक नहीं बनता है। यह सिस्टम को लगभग रैखिक स्पीडअप और स्केलअप प्राप्त करने की अनुमति देता है, यही कारण है कि यह स्केलेबल समानांतर और विश्लेषणात्मक डेटाबेस के लिए मानक वास्तुकला बन गया।