ScholarGate
المساعد

معالجة الاستعلامات وتحسينها

تُعد معالجة الاستعلامات وتحسينها جزءًا من نظام قاعدة البيانات يحوّل الاستعلام التصريحي إلى خطة تنفيذ فعالة، باختيار العمليات الفيزيائية ومسارات الوصول لتقليل التكلفة عبر مجموعات البيانات الكبيرة.

اعثر على موضوع باستخدام PaperMindقريبًاFind papers & topics
Tools & resources
تنزيل الشرائح
Learn & explore
فيديوقريبًا

Definition

معالجة الاستعلامات هي مجموعة الأنشطة التي يقوم بها نظام قاعدة البيانات لتحليل الاستعلام وتحسينه وتنفيذه؛ وتحسين الاستعلامات هو البحث عن خطة تنفيذ ذات تكلفة تقديرية منخفضة من بين العديد من الخطط المتكافئة منطقيًا للاستعلام.

Scope

يغطي هذا المجال المسار من الاستعلام المحلل إلى النتائج: ترجمة لغة الاستعلامات المهيكلة (SQL) إلى تعبيرات الجبر العلائقي، والعمليات الفيزيائية التي تنفذ كل عملية جبرية (المسح، والربط، والفرز، والتجميع)، والفهارس وطرق الوصول التي توفر مسارات سريعة للبيانات، والمُحسِّن القائم على التكلفة الذي يستخدم الإحصائيات للاختيار بين الخطط المتكافئة. يستثني هذا المجال التحكم في المعاملات والتزامن وتصميم المخططات؛ ويركز على كيفية تقييم استعلام واحد بكفاءة.

Sub-topics

Core questions

  • كيف يُترجم الاستعلام التصريحي إلى شجرة من العمليات الفيزيائية؟
  • ما هي الخوارزميات الفيزيائية التي تنفذ الاختيار، والربط، والفرز، والتجميع؟
  • كيف تسرّع الفهارس وطرق الوصول استرجاع البيانات؟
  • كيف يقدّر المُحسِّن القائم على التكلفة تكلفة الخطة ويختار من بين الخطط؟
  • لماذا يمكن أن تختلف الاستعلامات المتكافئة منطقيًا بشكل كبير في تكلفة التنفيذ؟

Key concepts

  • خطة الاستعلام الفيزيائية
  • تكافؤات الجبر العلائقي
  • خوارزميات الربط
  • الفرز والفرز الدمجي الخارجي
  • الفهارس وطرق الوصول
  • تقدير الانتقائية والكاردينالية
  • نموذج التكلفة
  • تعداد ترتيب الربط
  • التدفق والتجسيد

Key theories

توليد الخطة المنطقية إلى الفيزيائية
يُعاد كتابة الاستعلام أولاً باستخدام تكافؤات الجبر العلائقي إلى خطط منطقية مرشحة، ثم تُعيّن كل عملية جبرية إلى خوارزمية فيزيائية، مما ينتج عنه خطط قابلة للتنفيذ يمكن مقارنة تكاليفها.
التحسين القائم على التكلفة
يستخدم المُحسِّن الإحصائيات حول أحجام الجداول وتوزيعات القيم لتقدير تكلفة الخطط البديلة — خاصة ترتيبات الربط ومسارات الوصول — ويختار الأقل تكلفة، وهو نهج كان رائدًا من قبل مُحسِّن نظام System R.
اختيار مسار الوصول
يُعد اختيار ما إذا كان سيتم مسح جدول، أو استخدام فهرس، أو استغلال التجميع لكل عملية أمرًا أساسيًا للأداء؛ يوازن المُحسِّن تقديرات الانتقائية وتكلفة الإدخال/الإخراج لاختيار أفضل مسار وصول.

Clinical relevance

تحسين الاستعلامات هو ما يجعل قواعد البيانات العلائقية قابلة للاستخدام على نطاق واسع: يمكن أن يعمل نفس استعلام SQL في أجزاء من الثانية أو ساعات اعتمادًا على الخطة المختارة، لذا فإن جودة المُحسِّن تحدد بشكل مباشر أداء تحليلات الأعمال، ومعالجة المعاملات، والتطبيقات كثيفة البيانات.

History

لقد أرسى المُحسِّن القائم على التكلفة لنظام IBM System R (سيلينجر وآخرون، 1979) النهج السائد: تعداد الخطط، وتقدير التكاليف من الإحصائيات، واستخدام البرمجة الديناميكية لترتيب الربط. أضافت عقود من التحسين تقديرًا أفضل للكاردينالية، وعمليات جديدة، وتقنيات تكيفية، لكن الإطار الأساسي لا يزال هو أساس مُحسِّنات الاستعلامات الحديثة.

Debates

موثوقية تقدير الكاردينالية
تعتمد مُحسِّنات التكلفة على تقديرات أحجام النتائج الوسيطة، والتي قد تكون خاطئة بشكل كبير للبيانات المترابطة أو المنحرفة؛ يناقش الباحثون مقدار الاستثمار في إحصائيات أفضل ومقدرات مُتعلمة مقابل إعادة التحسين التكيفي في وقت التشغيل.

Key figures

  • Patricia Selinger
  • Jeffrey D. Ullman
  • Michael Stonebraker

Related topics

Seminal works

  • selinger1979
  • garciamolina2008
  • silberschatz2019

Frequently asked questions

لماذا يعمل نفس الاستعلام بسرعة على نظام وببطء على نظام آخر؟
يعتمد الأداء على خطة التنفيذ التي يختارها المُحسِّن، والتي بدورها تعتمد على الفهارس المتاحة، والإحصائيات حول البيانات، ونموذج التكلفة. يمكن للأنظمة المختلفة، أو نفس النظام بإحصائيات قديمة، اختيار خطط مختلفة جدًا — على سبيل المثال ترتيب ربط مختلف أو مسح فهرس مقابل مسح جدول كامل.
ما هو الجزء الأصعب في تحسين الاستعلامات؟
التقدير الدقيق لأحجام النتائج الوسيطة (تقدير الكاردينالية). تتراكم الأخطاء عبر عمليات الربط، لذا فإن تقديرًا خاطئًا صغيرًا في وقت مبكر من الخطة يمكن أن يؤدي بالمُحسِّن إلى اختيار ترتيب ربط أو مسار وصول أسوأ بشكل كبير. لهذا السبب يظل تقدير الكاردينالية مشكلة بحثية نشطة.

Methods for this concept

Related concepts