انبار داده و پردازش تحلیلی آنلاین (OLAP)
انبار داده، دادهها را از منابع متعدد در یک مخزن بهینهشده برای پرسوجو جهت تحلیل یکپارچه میکند و پردازش تحلیلی آنلاین (OLAP) مدل چندبعدی و عملیاتی را فراهم میآورد که به تحلیلگران امکان میدهد تا این دادهها را به صورت تعاملی کاوش کنند.
Definition
انبار داده یک مخزن یکپارچه و بهینهشده برای پرسوجو از دادههای تاریخی یکپارچه است که از چندین منبع عملیاتی برای تحلیل استخراج میشود؛ OLAP فناوریای است که چنین دادههایی را در یک مدل چندبعدی سازماندهی میکند و از پرسوجوهای تجمعی سریع و کاوش تعاملی پشتیبانی میکند.
Scope
این موضوع جنبه تحلیلی مدیریت داده را پوشش میدهد: انبار داده به عنوان یک مخزن یکپارچه و موضوعمحور جدا از سیستمهای عملیاتی؛ خط لوله استخراج-تبدیل-بارگذاری (ETL) که آن را پر میکند؛ مدلسازی ابعادی با شمای ستارهای و دانهبرفی از حقایق و ابعاد؛ مکعب داده چندبعدی و عملیات OLAP (تجمیع، جزئیسازی، برش، تکهتکه کردن، چرخش)؛ و تفاوت بین بارهای کاری تحلیلی (OLAP) و تراکنشی (OLTP). این موضوع کنترل همزمانی تراکنشی و مخازن عمومی NoSQL را که موضوعات مرتبطی هستند، شامل نمیشود.
Core questions
- انبار داده چه تفاوتی با پایگاه داده عملیاتی (OLTP) دارد؟
- مدلسازی ابعادی چیست و شمای ستارهای و دانهبرفی چگونه حقایق و ابعاد را سازماندهی میکنند؟
- مکعب داده چگونه گروه بندی را تعمیم میدهد و از تحلیل چندبعدی پشتیبانی میکند؟
- عملیات OLAP تجمیع (roll-up)، جزئیسازی (drill-down)، برش (slice)، تکهتکه کردن (dice) و چرخش (pivot) چه کاری انجام میدهند؟
- فرآیند ETL چگونه برای یکپارچهسازی و بارگذاری دادههای انبار استفاده میشود؟
Key concepts
- انبار داده
- استخراج-تبدیل-بارگذاری (ETL)
- شمای ستارهای و دانهبرفی
- جداول حقیقت و بعد
- مکعب داده
- تجمیع، جزئیسازی، برش، تکهتکه کردن، چرخش
- نماهای مادیشده
- OLAP در مقابل OLTP
Key theories
- مدلسازی ابعادی
- انبارها معمولاً با شمای ستارهای و دانهبرفی مدلسازی میشوند که در آن یک جدول حقیقت مرکزی از اندازهگیریها به جداول ابعاد اطراف (زمان، محصول، مکان) ارجاع میدهد و برای پرسوجوهای تجمعی و با حجم خواندن بالا که تحلیلگران اجرا میکنند، بهینهسازی میشود.
- مکعب داده و عملیات OLAP
- عملگر مکعب داده، گروه بندی را برای محاسبه تجمیعها بر روی تمام ترکیبات ابعاد تعمیم میدهد و از تجمیع، جزئیسازی، برش، تکهتکه کردن و چرخش برای تحلیل چندبعدی تعاملی پشتیبانی میکند.
- جداسازی OLAP از OLTP
- بارهای کاری تحلیلی حجم زیادی از دادههای تاریخی را اسکن و تجمیع میکنند، که اساساً با بهروزرسانیهای تراکنشی کوتاه متفاوت است، و این امر انبار دادهای جداگانه، یکپارچه و بهینهشده برای خواندن را که توسط ETL از سیستمهای عملیاتی پر میشود، ضروری میسازد.
Clinical relevance
انبار داده و OLAP اساس هوش تجاری هستند: سازمانها دادههای عملیاتی را در انبارهای داده یکپارچه میکنند و از OLAP برای تحلیل فروش، مالی و عملیات در ابعادی مانند زمان، منطقه و محصول استفاده میکنند، که این فناوریها را برای تصمیمگیری مبتنی بر داده حیاتی میسازد.
History
انبار داده در اوایل دهه 1990 با جداسازی پرسوجوهای تحلیلی از پایگاههای داده عملیاتی توسط سازمانها ظهور کرد؛ رویکرد مدلسازی ابعادی کیمبال و رویکرد انبار سازمانی اینمون این حوزه را شکل دادند. عملگر مکعب داده (Gray و همکاران، 1997) تجمیع چندبعدی را رسمی کرد، و بررسی Chaudhuri و Dayal در سال 1997 فناوری انبار داده و OLAP را که زیربنای پلتفرمهای تحلیلی مدرن است، یکپارچه ساخت.
Key figures
- Surajit Chaudhuri
- Umeshwar Dayal
- Jim Gray
- Ralph Kimball
Related topics
Seminal works
- chaudhuri1997
- gray1997
- kimball2013
Frequently asked questions
- تفاوت بین OLAP و OLTP چیست؟
- OLTP (پردازش تراکنش آنلاین) بسیاری از تراکنشهای کوتاه خواندن-نوشتن، مانند ثبت سفارش، را با تأکید بر سازگاری و بهروزرسانیهای سریع مدیریت میکند. OLAP (پردازش تحلیلی آنلاین) پرسوجوهای پیچیده و عمدتاً خواندنی را که حجم زیادی از دادههای تاریخی را برای تحلیل تجمیع میکنند، مدیریت میکند. انبارها برای OLAP طراحی شدهاند و از سیستمهای OLTP که آنها را تغذیه میکنند، جدا نگه داشته میشوند.
- چرا به جای طراحی کاملاً نرمالسازی شده، از شمای ستارهای استفاده کنیم؟
- پرسوجوهای تحلیلی معمولاً یک جدول حقیقت بزرگ را به چندین جدول ابعاد متصل کرده و تجمیع میکنند. شمای ستارهای عمداً ابعاد را دنرمالسازی میکند تا اتصالات را به حداقل برساند و این پرسوجوهای تجمعی را سریع و شهودی کند. افزونگی که نرمالسازی حذف میکند، در اینجا قابل قبول است زیرا انبار به صورت انبوه بارگذاری میشود و بسیار بیشتر از آنکه بهروزرسانی شود، مورد پرسوجو قرار میگیرد.