ScholarGate
सहायक

वितरित और समानांतर डेटाबेस

वितरित और समानांतर डेटाबेस डेटा और क्वेरी प्रोसेसिंग को कई मशीनों में फैलाते हैं ताकि डेटा के सुसंगत दृश्य को बनाए रखते हुए स्केलेबिलिटी, उपलब्धता और उच्च प्रदर्शन प्राप्त किया जा सके।

PaperMind से विषय खोजेंजल्द हीFind papers & topics
Tools & resources
स्लाइड डाउनलोड करें
Learn & explore
वीडियोजल्द ही

Definition

एक वितरित डेटाबेस कई नेटवर्क वाली साइटों में डेटा संग्रहीत करता है जो उपयोगकर्ताओं को एक एकल डेटाबेस के रूप में दिखाई देती हैं, और एक समानांतर डेटाबेस उच्च थ्रूपुट और कम विलंबता के लिए डेटाबेस संचालन को समवर्ती रूप से निष्पादित करने के लिए कई प्रोसेसर और डिस्क (आमतौर पर साझा-कुछ भी नहीं) का उपयोग करता है।

Scope

यह क्षेत्र कई नोड्स में डेटा के प्रबंधन को कवर करता है: डेटा को कैसे विभाजित (खंडित) और प्रतिकृत किया जाता है; विभाजन और वितरित साइटों में क्वेरीज़ को समानांतर में कैसे संसाधित किया जाता है; और लेनदेन परमाणु रूप से कैसे प्रतिबद्ध होते हैं और प्रतिकृतियां प्रतिबद्धता और आम सहमति प्रोटोकॉल के माध्यम से सुसंगत रहती हैं। यह साझा-कुछ भी नहीं समानांतर डेटाबेस और भौगोलिक रूप से वितरित डेटाबेस के बीच वास्तुशिल्प अंतर को मानता है। यह सामान्य वितरित-कंप्यूटिंग विषयों का डेटाबेस-विशिष्ट पूरक है, जिसे यह उद्धृत करता है लेकिन दोहराता नहीं है; यह डेटाबेस उपयोग से परे सामान्य-उद्देश्य आम सहमति और वितरित-प्रणाली सिद्धांत को बाहर करता है।

Sub-topics

Core questions

  • डेटा को नोड्स में कैसे विभाजित और प्रतिकृत किया जाता है, और क्यों?
  • क्वेरीज़ को विभाजन और साइटों में समानांतर में कैसे निष्पादित किया जाता है?
  • जब कोई लेनदेन कई नोड्स में फैला होता है तो उसे परमाणु रूप से कैसे प्रतिबद्ध किया जाता है?
  • विफलताओं की उपस्थिति में प्रतिकृतियां कैसे सुसंगत रहती हैं?
  • समानांतर (साझा-कुछ भी नहीं) और भौगोलिक रूप से वितरित डिज़ाइन कैसे भिन्न होते हैं?

Key concepts

  • क्षैतिज और ऊर्ध्वाधर विखंडन
  • प्रतिकृति
  • साझा-कुछ भी नहीं वास्तुकला
  • विभाजित और पाइपलाइन समानांतरता
  • वितरित क्वेरी प्रोसेसिंग
  • दो-चरण प्रतिबद्धता
  • आम सहमति और प्रतिकृति संगति
  • स्पीडअप और स्केलअप

Key theories

डेटा विभाजन और प्रतिकृति
स्केलेबिलिटी के लिए तालिकाओं को क्षैतिज या ऊर्ध्वाधर रूप से खंडित और नोड्स में वितरित किया जाता है, और उपलब्धता और पढ़ने के प्रदर्शन के लिए प्रतियां प्रतिकृत की जाती हैं; प्लेसमेंट रणनीति लोड संतुलन और दोष सहिष्णुता निर्धारित करती है।
समानांतर क्वेरी प्रोसेसिंग
साझा-कुछ भी नहीं समानांतर डेटाबेस डेटा को विभाजित करके और नोड्स में समानांतर में स्कैन और जॉइन जैसे ऑपरेटरों को निष्पादित करके लगभग रैखिक स्पीडअप और स्केलअप प्राप्त करते हैं, विभाजित और पाइपलाइन समानांतरता का लाभ उठाते हुए।
वितरित प्रतिबद्धता और प्रतिकृति संगति
दो-चरण प्रतिबद्धता जैसे परमाणु प्रतिबद्धता प्रोटोकॉल साइटों में सभी-या-कुछ भी परिणामों को सुनिश्चित करते हैं, और आम सहमति और प्रतिकृति प्रोटोकॉल नोड और नेटवर्क विफलताओं के बावजूद प्रतिकृतियों को सुसंगत रखते हैं।

Clinical relevance

वितरित और समानांतर डेटाबेस ही हैं जो डेटा सिस्टम को इंटरनेट वर्कलोड तक स्केल करने की अनुमति देते हैं: समानांतर डेटा वेयरहाउस पेटाबाइट्स पर विश्लेषण चलाते हैं, भौगोलिक रूप से वितरित डेटाबेस वैश्विक सेवाओं को उपलब्ध और कम विलंबता पर रखते हैं, और यहां विभाजन, प्रतिकृति और प्रतिबद्धता तकनीकें लगभग हर बड़े पैमाने के डेटा प्लेटफॉर्म का आधार हैं।

History

वितरित डेटाबेस अनुसंधान 1970 के दशक के अंत में SDD-1 और वितरित इंग्रेस जैसे सिस्टम के साथ शुरू हुआ। 1980 के दशक में साझा-कुछ भी नहीं समानांतर डेटाबेस (गामा, टेराडाटा) देखे गए, जिनके बारे में डेविट और ग्रे ने 1992 में तर्क दिया था कि वे उच्च-प्रदर्शन डेटा प्रबंधन का भविष्य थे। इंटरनेट-स्केल की मांगों ने बाद में विभाजित, प्रतिकृत प्रणालियों को प्रेरित किया जो आधुनिक क्लाउड डेटा प्लेटफॉर्म को परिभाषित करते हैं।

Key figures

  • M. Tamer Özsu
  • Patrick Valduriez
  • David DeWitt
  • Jim Gray

Related topics

Seminal works

  • ozsu2011
  • dewitt1992
  • silberschatz2019

Frequently asked questions

वितरित डेटाबेस और समानांतर डेटाबेस में क्या अंतर है?
एक समानांतर डेटाबेस क्वेरीज़ को तेज़ी से चलाने के लिए कई कसकर युग्मित प्रोसेसर और डिस्क का उपयोग करता है, आमतौर पर एक तेज़ इंटरकनेक्ट (अक्सर एक साझा-कुछ भी नहीं क्लस्टर) के साथ एक स्थान पर। एक वितरित डेटाबेस उपलब्धता और स्थानीयता के लिए डेटा को अलग-अलग, अक्सर भौगोलिक रूप से बिखरी हुई साइटों में फैलाता है। यह रेखा धुंधली हो जाती है, लेकिन समानांतर डेटाबेस प्रदर्शन पर जोर देते हैं और वितरित डेटाबेस वितरण और स्वायत्तता पर जोर देते हैं।
साझा-कुछ भी नहीं प्रमुख समानांतर वास्तुकला क्यों है?
साझा-कुछ भी नहीं डिज़ाइन में प्रत्येक नोड का अपना सीपीयू, मेमोरी और डिस्क होता है, इसलिए नोड्स जोड़ने पर कोई केंद्रीय संसाधन बॉटलनेक नहीं बनता है। यह सिस्टम को लगभग रैखिक स्पीडअप और स्केलअप प्राप्त करने की अनुमति देता है, यही कारण है कि यह स्केलेबल समानांतर और विश्लेषणात्मक डेटाबेस के लिए मानक वास्तुकला बन गया।

Methods for this concept

Related concepts