ScholarGate
دستیار

انبار داده و پردازش تحلیلی آنلاین (OLAP)

انبار داده، داده‌ها را از منابع متعدد در یک مخزن بهینه‌شده برای پرس‌وجو جهت تحلیل یکپارچه می‌کند و پردازش تحلیلی آنلاین (OLAP) مدل چندبعدی و عملیاتی را فراهم می‌آورد که به تحلیل‌گران امکان می‌دهد تا این داده‌ها را به صورت تعاملی کاوش کنند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics
Tools & resources
دریافت اسلایدها
Learn & explore
ویدیوبه‌زودی

Definition

انبار داده یک مخزن یکپارچه و بهینه‌شده برای پرس‌وجو از داده‌های تاریخی یکپارچه است که از چندین منبع عملیاتی برای تحلیل استخراج می‌شود؛ OLAP فناوری‌ای است که چنین داده‌هایی را در یک مدل چندبعدی سازماندهی می‌کند و از پرس‌وجوهای تجمعی سریع و کاوش تعاملی پشتیبانی می‌کند.

Scope

این موضوع جنبه تحلیلی مدیریت داده را پوشش می‌دهد: انبار داده به عنوان یک مخزن یکپارچه و موضوع‌محور جدا از سیستم‌های عملیاتی؛ خط لوله استخراج-تبدیل-بارگذاری (ETL) که آن را پر می‌کند؛ مدل‌سازی ابعادی با شمای ستاره‌ای و دانه‌برفی از حقایق و ابعاد؛ مکعب داده چندبعدی و عملیات OLAP (تجمیع، جزئی‌سازی، برش، تکه‌تکه کردن، چرخش)؛ و تفاوت بین بارهای کاری تحلیلی (OLAP) و تراکنشی (OLTP). این موضوع کنترل همزمانی تراکنشی و مخازن عمومی NoSQL را که موضوعات مرتبطی هستند، شامل نمی‌شود.

Core questions

  • انبار داده چه تفاوتی با پایگاه داده عملیاتی (OLTP) دارد؟
  • مدل‌سازی ابعادی چیست و شمای ستاره‌ای و دانه‌برفی چگونه حقایق و ابعاد را سازماندهی می‌کنند؟
  • مکعب داده چگونه گروه بندی را تعمیم می‌دهد و از تحلیل چندبعدی پشتیبانی می‌کند؟
  • عملیات OLAP تجمیع (roll-up)، جزئی‌سازی (drill-down)، برش (slice)، تکه‌تکه کردن (dice) و چرخش (pivot) چه کاری انجام می‌دهند؟
  • فرآیند ETL چگونه برای یکپارچه‌سازی و بارگذاری داده‌های انبار استفاده می‌شود؟

Key concepts

  • انبار داده
  • استخراج-تبدیل-بارگذاری (ETL)
  • شمای ستاره‌ای و دانه‌برفی
  • جداول حقیقت و بعد
  • مکعب داده
  • تجمیع، جزئی‌سازی، برش، تکه‌تکه کردن، چرخش
  • نماهای مادی‌شده
  • OLAP در مقابل OLTP

Key theories

مدل‌سازی ابعادی
انبارها معمولاً با شمای ستاره‌ای و دانه‌برفی مدل‌سازی می‌شوند که در آن یک جدول حقیقت مرکزی از اندازه‌گیری‌ها به جداول ابعاد اطراف (زمان، محصول، مکان) ارجاع می‌دهد و برای پرس‌وجوهای تجمعی و با حجم خواندن بالا که تحلیل‌گران اجرا می‌کنند، بهینه‌سازی می‌شود.
مکعب داده و عملیات OLAP
عملگر مکعب داده، گروه بندی را برای محاسبه تجمیع‌ها بر روی تمام ترکیبات ابعاد تعمیم می‌دهد و از تجمیع، جزئی‌سازی، برش، تکه‌تکه کردن و چرخش برای تحلیل چندبعدی تعاملی پشتیبانی می‌کند.
جداسازی OLAP از OLTP
بارهای کاری تحلیلی حجم زیادی از داده‌های تاریخی را اسکن و تجمیع می‌کنند، که اساساً با به‌روزرسانی‌های تراکنشی کوتاه متفاوت است، و این امر انبار داده‌ای جداگانه، یکپارچه و بهینه‌شده برای خواندن را که توسط ETL از سیستم‌های عملیاتی پر می‌شود، ضروری می‌سازد.

Clinical relevance

انبار داده و OLAP اساس هوش تجاری هستند: سازمان‌ها داده‌های عملیاتی را در انبارهای داده یکپارچه می‌کنند و از OLAP برای تحلیل فروش، مالی و عملیات در ابعادی مانند زمان، منطقه و محصول استفاده می‌کنند، که این فناوری‌ها را برای تصمیم‌گیری مبتنی بر داده حیاتی می‌سازد.

History

انبار داده در اوایل دهه 1990 با جداسازی پرس‌وجوهای تحلیلی از پایگاه‌های داده عملیاتی توسط سازمان‌ها ظهور کرد؛ رویکرد مدل‌سازی ابعادی کیمبال و رویکرد انبار سازمانی اینمون این حوزه را شکل دادند. عملگر مکعب داده (Gray و همکاران، 1997) تجمیع چندبعدی را رسمی کرد، و بررسی Chaudhuri و Dayal در سال 1997 فناوری انبار داده و OLAP را که زیربنای پلتفرم‌های تحلیلی مدرن است، یکپارچه ساخت.

Key figures

  • Surajit Chaudhuri
  • Umeshwar Dayal
  • Jim Gray
  • Ralph Kimball

Related topics

Seminal works

  • chaudhuri1997
  • gray1997
  • kimball2013

Frequently asked questions

تفاوت بین OLAP و OLTP چیست؟
OLTP (پردازش تراکنش آنلاین) بسیاری از تراکنش‌های کوتاه خواندن-نوشتن، مانند ثبت سفارش، را با تأکید بر سازگاری و به‌روزرسانی‌های سریع مدیریت می‌کند. OLAP (پردازش تحلیلی آنلاین) پرس‌وجوهای پیچیده و عمدتاً خواندنی را که حجم زیادی از داده‌های تاریخی را برای تحلیل تجمیع می‌کنند، مدیریت می‌کند. انبارها برای OLAP طراحی شده‌اند و از سیستم‌های OLTP که آن‌ها را تغذیه می‌کنند، جدا نگه داشته می‌شوند.
چرا به جای طراحی کاملاً نرمال‌سازی شده، از شمای ستاره‌ای استفاده کنیم؟
پرس‌وجوهای تحلیلی معمولاً یک جدول حقیقت بزرگ را به چندین جدول ابعاد متصل کرده و تجمیع می‌کنند. شمای ستاره‌ای عمداً ابعاد را دنرمال‌سازی می‌کند تا اتصالات را به حداقل برساند و این پرس‌وجوهای تجمعی را سریع و شهودی کند. افزونگی که نرمال‌سازی حذف می‌کند، در اینجا قابل قبول است زیرا انبار به صورت انبوه بارگذاری می‌شود و بسیار بیشتر از آنکه به‌روزرسانی شود، مورد پرس‌وجو قرار می‌گیرد.

Methods for this concept

Related concepts