مستودعات البيانات والمعالجة التحليلية عبر الإنترنت (OLAP)
تعمل مستودعات البيانات على دمج البيانات من مصادر متعددة في مخزن مُحسّن للاستعلامات لأغراض التحليل، وتوفر المعالجة التحليلية عبر الإنترنت (OLAP) النموذج متعدد الأبعاد والعمليات التي تتيح للمحللين استكشاف تلك البيانات بشكل تفاعلي.
Definition
مستودع البيانات هو مستودع موحد ومُحسّن للاستعلامات للبيانات التاريخية المتكاملة المستمدة من مصادر تشغيلية متعددة لأغراض التحليل؛ والمعالجة التحليلية عبر الإنترنت (OLAP) هي التقنية التي تنظم هذه البيانات في نموذج متعدد الأبعاد وتدعم الاستعلامات التجميعية السريعة والاستكشاف التفاعلي.
Scope
يغطي هذا الموضوع الجانب التحليلي لإدارة البيانات: مستودع البيانات كمخزن متكامل وموجه نحو الموضوعات ومنفصل عن الأنظمة التشغيلية؛ وخط أنابيب الاستخراج والتحويل والتحميل (ETL) الذي يغذيه؛ والنمذجة الأبعادية باستخدام مخططات النجمة وندفة الثلج للحقائق والأبعاد؛ ومكعب البيانات متعدد الأبعاد وعمليات المعالجة التحليلية عبر الإنترنت (OLAP) (التجميع، والتفصيل، والتقطيع، والتجزئة، والمحور)؛ والتباين بين أعباء العمل التحليلية (OLAP) والمعاملاتية (OLTP). ويستثني هذا الموضوع التحكم في التزامن للمعاملات ومخازن NoSQL العامة، والتي تعد مواضيع مجاورة.
Core questions
- كيف يختلف مستودع البيانات عن قاعدة البيانات التشغيلية (OLTP)؟
- ما هي النمذجة الأبعادية، وكيف تنظم مخططات النجمة وندفة الثلج الحقائق والأبعاد؟
- كيف يعمم مكعب البيانات التجميع (group-by) ويدعم التحليل متعدد الأبعاد؟
- ماذا تفعل عمليات المعالجة التحليلية عبر الإنترنت (OLAP) من تجميع (roll-up)، وتفصيل (drill-down)، وتقطيع (slice)، وتجزئة (dice)، ومحور (pivot)؟
- كيف تُستخدم عملية الاستخراج والتحويل والتحميل (ETL) لدمج وتحميل بيانات المستودع؟
Key concepts
- مستودع البيانات
- الاستخراج والتحويل والتحميل (ETL)
- مخططات النجمة وندفة الثلج
- جداول الحقائق والأبعاد
- مكعب البيانات
- التجميع، والتفصيل، والتقطيع، والتجزئة، والمحور
- العروض المادية (materialized views)
- المعالجة التحليلية عبر الإنترنت (OLAP) مقابل المعالجة المعاملاتية عبر الإنترنت (OLTP)
Key theories
- النمذجة الأبعادية
- عادةً ما تُنمذج المستودعات باستخدام مخططات النجمة وندفة الثلج حيث يشير جدول حقائق مركزي للقياسات إلى جداول أبعاد محيطة (الوقت، المنتج، الموقع)، مما يحسن الاستعلامات التجميعية كثيفة القراءة التي يجريها المحللون.
- مكعب البيانات وعمليات المعالجة التحليلية عبر الإنترنت (OLAP)
- يعمم عامل مكعب البيانات التجميع (group-by) لحساب التجميعات عبر جميع مجموعات الأبعاد، ويدعم التجميع (roll-up)، والتفصيل (drill-down)، والتقطيع (slice)، والتجزئة (dice)، والمحور (pivot) للتحليل التفاعلي متعدد الأبعاد.
- فصل المعالجة التحليلية عبر الإنترنت (OLAP) عن المعالجة المعاملاتية عبر الإنترنت (OLTP)
- تقوم أعباء العمل التحليلية بمسح وتجميع كميات كبيرة من البيانات التاريخية، وهو ما يختلف جوهريًا عن التحديثات المعاملاتية القصيرة، مما يحفز وجود مستودع منفصل ومتكامل ومُحسّن للقراءة يتم تغذيته بواسطة الاستخراج والتحويل والتحميل (ETL) من الأنظمة التشغيلية.
Clinical relevance
تُعد مستودعات البيانات والمعالجة التحليلية عبر الإنترنت (OLAP) أساس ذكاء الأعمال: حيث تقوم المؤسسات بدمج البيانات التشغيلية في المستودعات وتستخدم المعالجة التحليلية عبر الإنترنت (OLAP) لتحليل المبيعات والمالية والعمليات عبر أبعاد مثل الوقت والمنطقة والمنتج، مما يجعل هذه التقنيات محورية في اتخاذ القرارات المستندة إلى البيانات.
History
ظهرت مستودعات البيانات في أوائل التسعينيات عندما فصلت المؤسسات الاستعلام التحليلي عن قواعد البيانات التشغيلية؛ وقد شكل نهج كيمبال للنمذجة الأبعادية ونهج إنمون لمستودعات المؤسسات هذا المجال. وقد أضفى عامل مكعب البيانات (Gray et al., 1997) الطابع الرسمي على التجميع متعدد الأبعاد، وقدمت مراجعة شودري وديال عام 1997 نظرة عامة موحدة على تقنية مستودعات البيانات والمعالجة التحليلية عبر الإنترنت (OLAP) التي تقوم عليها منصات التحليلات الحديثة.
Key figures
- Surajit Chaudhuri
- Umeshwar Dayal
- Jim Gray
- Ralph Kimball
Related topics
Seminal works
- chaudhuri1997
- gray1997
- kimball2013
Frequently asked questions
- ما الفرق بين المعالجة التحليلية عبر الإنترنت (OLAP) والمعالجة المعاملاتية عبر الإنترنت (OLTP)؟
- تتعامل المعالجة المعاملاتية عبر الإنترنت (OLTP) مع العديد من المعاملات القصيرة للقراءة والكتابة، مثل تقديم طلب، مع التركيز على الاتساق والتحديثات السريعة. بينما تتعامل المعالجة التحليلية عبر الإنترنت (OLAP) مع استعلامات معقدة غالبًا ما تكون للقراءة فقط وتجمع كميات كبيرة من البيانات التاريخية للتحليل. تُصمم المستودعات للمعالجة التحليلية عبر الإنترنت (OLAP) وتُفصل عن أنظمة المعالجة المعاملاتية عبر الإنترنت (OLTP) التي تغذيها.
- لماذا نستخدم مخطط النجمة بدلاً من تصميم معياري بالكامل؟
- عادةً ما تربط الاستعلامات التحليلية جدول حقائق كبير بعدة جداول أبعاد وتقوم بالتجميع. يقوم مخطط النجمة بتفكيك الأبعاد عمدًا لتقليل عمليات الربط وجعل استعلامات التجميع هذه سريعة وبديهية. إن التكرار الذي قد يزيله التوحيد القياسي مقبول هنا لأن المستودع يُحمّل بكميات كبيرة ويُستعلم عنه أكثر بكثير مما يُحدّث.