ScholarGate
المساعد

تكرار البيانات واتساقها

يحافظ تكرار البيانات على نسخ متعددة من البيانات لضمان التوافر والأداء، وتحكم بروتوكولات الاتساق كيفية التوفيق بين عمليات القراءة والكتابة عبر تلك النسخ.

اعثر على موضوع باستخدام PaperMindقريبًاFind papers & topics
Tools & resources
تنزيل الشرائح
Learn & explore
فيديوقريبًا

Definition

يحافظ تكرار البيانات على نسخ من عنصر بيانات على عدة عقد؛ ويحدد نموذج الاتساق الضمانات المتعلقة بالقيم التي قد تُرجعها عمليات القراءة بالنظر إلى تاريخ عمليات الكتابة، بدءًا من القوي (كل قراءة ترى أحدث كتابة) إلى النهائي (تتقارب النسخ إذا توقفت التحديثات).

Scope

يغطي هذا الموضوع استراتيجيات التكرار (الأساسي-الاحتياطي، متعدد الأسياد، النصاب)، وبروتوكولات القراءة/الكتابة القائمة على النصاب ومتطلبات تقاطعها، ومكافحة الانتروبيا (anti-entropy) والثرثرة (gossip) للتقارب النهائي، واكتشاف التعارض باستخدام متجهات الإصدار (version vectors) وأنواع البيانات المنسوخة الخالية من التعارض (CRDTs)، وطيف الاتساق من الاتساق الخطي (linearizable) إلى الاتساق النهائي (eventual). ويتناول هذا الموضوع النظير على مستوى البيانات لتكرار آلة الحالة (state-machine replication).

Core questions

  • كيف تضمن أحجام النصاب لعمليات القراءة والكتابة أن عمليات القراءة تلاحظ أحدث كتابة؟
  • كيف تتقارب النسخ في ظل الاتساق النهائي، وكيف تُحل التعارضات؟
  • ما هو مستوى الاتساق الذي يجب أن يختاره التطبيق بالنظر إلى احتياجاته من زمن الاستجابة والتوافر؟

Key theories

إجماع النصاب للبيانات المنسوخة
من خلال تخصيص أصوات للنسخ وطلب نصاب للقراءة والكتابة يكون مجموع أحجامه أكبر من المجموع الكلي، يتقاطع كل نصاب قراءة مع أحدث نصاب كتابة، مما يضمن أن عمليات القراءة تلاحظ البيانات المحدثة.
الاتساق النهائي ومكافحة الانتروبيا
تقبل المخازن عالية التوافر عمليات الكتابة في أي نسخة وتوفق بينها بشكل غير متزامن عبر الثرثرة (gossip) ومتجهات الإصدار (version vectors)، مما يضمن فقط تقارب النسخ عند توقف التحديثات، كما يتضح من تصميم Dynamo.
أنواع البيانات المنسوخة الخالية من التعارض
CRDTs هي أنواع بيانات صُممت عملياتها لتكون تبادلية (commute) أو تشكل حالاتها شبه شبكة انضمام (join-semilattice)، بحيث تندمج التحديثات المتزامنة بشكل حتمي دون تنسيق، مما يوفر اتساقًا نهائيًا قويًا.

Clinical relevance

تحدد هذه التقنيات ضمانات أنظمة التخزين الحقيقية: فبروتوكولات النصاب تشكل أساس مخازن المفتاح-القيمة (key-value stores) ذات الاتساق القوي، بينما يدعم الاتساق النهائي وأنواع البيانات المنسوخة الخالية من التعارض (CRDTs) المخازن عالية التوافر، وعربات التسوق، والمحررات التعاونية حيث يتفوق التوافر على الاتفاق الفوري.

History

أرسى مخطط التصويت المرجح (weighted-voting scheme) لـ Gifford عام 1979 تكرار النصاب؛ وشاعت ورقة Dynamo من Amazon عام 2007 الاتساق النهائي عالي التوافر؛ وقدم إضفاء الطابع الرسمي على CRDTs عام 2011 أساسًا مبدئيًا للتقارب الخالي من التنسيق، مما شكل تصميم البيانات المنسوخة الحديثة.

Debates

ما مدى الاتساق الذي يجب أن توفره البيانات المنسوخة افتراضيًا؟
يسهل الاتساق القوي تطوير التطبيقات ولكنه يحد من التوافر ويزيد من زمن الاستجابة، بينما يزيد الاتساق النهائي من التوافر إلى أقصى حد على حساب كشف التباعد المؤقت؛ وتعد النصابات القابلة للضبط وCRDTs محاولات للسماح للتطبيقات بالاختيار لكل عملية.

Key figures

  • David Gifford
  • Werner Vogels
  • Marc Shapiro
  • Andrew S. Tanenbaum

Related topics

Seminal works

  • gifford1979
  • decandia2007
  • shapiro2011

Frequently asked questions

كيف تضمن نصابات القراءة والكتابة قراءات حديثة؟
إذا كان يجب أن تصل عملية كتابة إلى W نسخة ويجب أن تستشير عملية قراءة R نسخة، وكان مجموع R و W يتجاوز العدد الإجمالي للنسخ، فإن أي نصاب قراءة يتداخل مع أحدث نصاب كتابة في نسخة واحدة على الأقل، وبالتالي يمكن للقراءة ملاحظة أحدث قيمة.

Methods for this concept

Related concepts