वितरित डेटाबेस और समानांतर डेटाबेस में क्या अंतर है?

एक समानांतर डेटाबेस क्वेरीज़ को तेज़ी से चलाने के लिए कई कसकर युग्मित प्रोसेसर और डिस्क का उपयोग करता है, आमतौर पर एक तेज़ इंटरकनेक्ट (अक्सर एक साझा-कुछ भी नहीं क्लस्टर) के साथ एक स्थान पर। एक वितरित डेटाबेस उपलब्धता और स्थानीयता के लिए डेटा को अलग-अलग, अक्सर भौगोलिक रूप से बिखरी हुई साइटों में फैलाता है। यह रेखा धुंधली हो जाती है, लेकिन समानांतर डेटाबेस प्रदर्शन पर जोर देते हैं और वितरित डेटाबेस वितरण और स्वायत्तता पर जोर देते हैं।

साझा-कुछ भी नहीं प्रमुख समानांतर वास्तुकला क्यों है?

साझा-कुछ भी नहीं डिज़ाइन में प्रत्येक नोड का अपना सीपीयू, मेमोरी और डिस्क होता है, इसलिए नोड्स जोड़ने पर कोई केंद्रीय संसाधन बॉटलनेक नहीं बनता है। यह सिस्टम को लगभग रैखिक स्पीडअप और स्केलअप प्राप्त करने की अनुमति देता है, यही कारण है कि यह स्केलेबल समानांतर और विश्लेषणात्मक डेटाबेस के लिए मानक वास्तुकला बन गया।

वितरित और समानांतर डेटाबेस

वितरित और समानांतर डेटाबेस डेटा और क्वेरी प्रोसेसिंग को कई मशीनों में फैलाते हैं ताकि डेटा के सुसंगत दृश्य को बनाए रखते हुए स्केलेबिलिटी, उपलब्धता और उच्च प्रदर्शन प्राप्त किया जा सके।

PaperMind से विषय खोजेंजल्द हीFind papers & topics

Tools & resources

स्लाइड डाउनलोड करें

Learn & explore

वीडियोजल्द ही

Definition

एक वितरित डेटाबेस कई नेटवर्क वाली साइटों में डेटा संग्रहीत करता है जो उपयोगकर्ताओं को एक एकल डेटाबेस के रूप में दिखाई देती हैं, और एक समानांतर डेटाबेस उच्च थ्रूपुट और कम विलंबता के लिए डेटाबेस संचालन को समवर्ती रूप से निष्पादित करने के लिए कई प्रोसेसर और डिस्क (आमतौर पर साझा-कुछ भी नहीं) का उपयोग करता है।

Scope

यह क्षेत्र कई नोड्स में डेटा के प्रबंधन को कवर करता है: डेटा को कैसे विभाजित (खंडित) और प्रतिकृत किया जाता है; विभाजन और वितरित साइटों में क्वेरीज़ को समानांतर में कैसे संसाधित किया जाता है; और लेनदेन परमाणु रूप से कैसे प्रतिबद्ध होते हैं और प्रतिकृतियां प्रतिबद्धता और आम सहमति प्रोटोकॉल के माध्यम से सुसंगत रहती हैं। यह साझा-कुछ भी नहीं समानांतर डेटाबेस और भौगोलिक रूप से वितरित डेटाबेस के बीच वास्तुशिल्प अंतर को मानता है। यह सामान्य वितरित-कंप्यूटिंग विषयों का डेटाबेस-विशिष्ट पूरक है, जिसे यह उद्धृत करता है लेकिन दोहराता नहीं है; यह डेटाबेस उपयोग से परे सामान्य-उद्देश्य आम सहमति और वितरित-प्रणाली सिद्धांत को बाहर करता है।

Sub-topics

Core questions

डेटा को नोड्स में कैसे विभाजित और प्रतिकृत किया जाता है, और क्यों?
क्वेरीज़ को विभाजन और साइटों में समानांतर में कैसे निष्पादित किया जाता है?
जब कोई लेनदेन कई नोड्स में फैला होता है तो उसे परमाणु रूप से कैसे प्रतिबद्ध किया जाता है?
विफलताओं की उपस्थिति में प्रतिकृतियां कैसे सुसंगत रहती हैं?
समानांतर (साझा-कुछ भी नहीं) और भौगोलिक रूप से वितरित डिज़ाइन कैसे भिन्न होते हैं?

Key concepts

क्षैतिज और ऊर्ध्वाधर विखंडन
प्रतिकृति
साझा-कुछ भी नहीं वास्तुकला
विभाजित और पाइपलाइन समानांतरता
वितरित क्वेरी प्रोसेसिंग
दो-चरण प्रतिबद्धता
आम सहमति और प्रतिकृति संगति
स्पीडअप और स्केलअप

Key theories

डेटा विभाजन और प्रतिकृति: स्केलेबिलिटी के लिए तालिकाओं को क्षैतिज या ऊर्ध्वाधर रूप से खंडित और नोड्स में वितरित किया जाता है, और उपलब्धता और पढ़ने के प्रदर्शन के लिए प्रतियां प्रतिकृत की जाती हैं; प्लेसमेंट रणनीति लोड संतुलन और दोष सहिष्णुता निर्धारित करती है।
समानांतर क्वेरी प्रोसेसिंग: साझा-कुछ भी नहीं समानांतर डेटाबेस डेटा को विभाजित करके और नोड्स में समानांतर में स्कैन और जॉइन जैसे ऑपरेटरों को निष्पादित करके लगभग रैखिक स्पीडअप और स्केलअप प्राप्त करते हैं, विभाजित और पाइपलाइन समानांतरता का लाभ उठाते हुए।
वितरित प्रतिबद्धता और प्रतिकृति संगति: दो-चरण प्रतिबद्धता जैसे परमाणु प्रतिबद्धता प्रोटोकॉल साइटों में सभी-या-कुछ भी परिणामों को सुनिश्चित करते हैं, और आम सहमति और प्रतिकृति प्रोटोकॉल नोड और नेटवर्क विफलताओं के बावजूद प्रतिकृतियों को सुसंगत रखते हैं।

Clinical relevance

वितरित और समानांतर डेटाबेस ही हैं जो डेटा सिस्टम को इंटरनेट वर्कलोड तक स्केल करने की अनुमति देते हैं: समानांतर डेटा वेयरहाउस पेटाबाइट्स पर विश्लेषण चलाते हैं, भौगोलिक रूप से वितरित डेटाबेस वैश्विक सेवाओं को उपलब्ध और कम विलंबता पर रखते हैं, और यहां विभाजन, प्रतिकृति और प्रतिबद्धता तकनीकें लगभग हर बड़े पैमाने के डेटा प्लेटफॉर्म का आधार हैं।

History

वितरित डेटाबेस अनुसंधान 1970 के दशक के अंत में SDD-1 और वितरित इंग्रेस जैसे सिस्टम के साथ शुरू हुआ। 1980 के दशक में साझा-कुछ भी नहीं समानांतर डेटाबेस (गामा, टेराडाटा) देखे गए, जिनके बारे में डेविट और ग्रे ने 1992 में तर्क दिया था कि वे उच्च-प्रदर्शन डेटा प्रबंधन का भविष्य थे। इंटरनेट-स्केल की मांगों ने बाद में विभाजित, प्रतिकृत प्रणालियों को प्रेरित किया जो आधुनिक क्लाउड डेटा प्लेटफॉर्म को परिभाषित करते हैं।

Key figures

M. Tamer Özsu
Patrick Valduriez
David DeWitt
Jim Gray

Seminal works

ozsu2011
dewitt1992
silberschatz2019

Frequently asked questions

वितरित डेटाबेस और समानांतर डेटाबेस में क्या अंतर है?: एक समानांतर डेटाबेस क्वेरीज़ को तेज़ी से चलाने के लिए कई कसकर युग्मित प्रोसेसर और डिस्क का उपयोग करता है, आमतौर पर एक तेज़ इंटरकनेक्ट (अक्सर एक साझा-कुछ भी नहीं क्लस्टर) के साथ एक स्थान पर। एक वितरित डेटाबेस उपलब्धता और स्थानीयता के लिए डेटा को अलग-अलग, अक्सर भौगोलिक रूप से बिखरी हुई साइटों में फैलाता है। यह रेखा धुंधली हो जाती है, लेकिन समानांतर डेटाबेस प्रदर्शन पर जोर देते हैं और वितरित डेटाबेस वितरण और स्वायत्तता पर जोर देते हैं।
साझा-कुछ भी नहीं प्रमुख समानांतर वास्तुकला क्यों है?: साझा-कुछ भी नहीं डिज़ाइन में प्रत्येक नोड का अपना सीपीयू, मेमोरी और डिस्क होता है, इसलिए नोड्स जोड़ने पर कोई केंद्रीय संसाधन बॉटलनेक नहीं बनता है। यह सिस्टम को लगभग रैखिक स्पीडअप और स्केलअप प्राप्त करने की अनुमति देता है, यही कारण है कि यह स्केलेबल समानांतर और विश्लेषणात्मक डेटाबेस के लिए मानक वास्तुकला बन गया।