طراحی و معماری انبار داده بالینی
انبار داده بالینی یک مخزن یکپارچه و پرسوجو محور است که دادهها را از منابع تراکنشی یک سیستم بهداشتی تجمیع میکند تا بتوان آنها را بدون ایجاد اختلال در سیستمهای عملیاتی مراقبت، تحلیل کرد. طراحی و معماری آن تعیین میکند که چگونه دادههای منبع برای تحقیق، اندازهگیری کیفیت و گزارشدهی عملیاتی استخراج، مدلسازی و ارائه میشوند.
Definition
طراحی انبار داده بالینی، معماری و مهندسی مخازن یکپارچهای است که دادههای سلامت را از چندین منبع عملیاتی در ساختاری بهینه شده برای پرسوجو، تحلیل و استفاده مجدد، به جای مراقبت تراکنشی، تجمیع میکند.
Scope
این موضوع الگوهای معماری پشت انبارهای داده بالینی را پوشش میدهد: جداسازی سیستمهای تحلیلی از تراکنشی، خطوط لوله استخراج-تبدیل-بارگذاری (ETL)، مدلسازی ابعادی در مقابل نرمالشده، و استفاده از مدلهای داده مشترک برای قابل حمل کردن پرسوجوها. این موضوع طراحی انبار داده را به عنوان یک مبحث انفورماتیک و مهندسی داده در نظر میگیرد، نه دستورالعملهای عملیاتی برای یک پلتفرم خاص.
Key concepts
- جداسازی بارهای کاری تحلیلی و تراکنشی (OLAP در مقابل OLTP)
- خطوط لوله استخراج-تبدیل-بارگذاری (ETL)
- مدلسازی ابعادی (طرحهای ستارهای و برفدانه)
- طراحی انبار سازمانی نرمالشده (فرم نرمال سوم)
- مدلهای داده مشترک
- بازارهای داده (Data Marts)
- فراداده و ریشهشناسی داده (Data Lineage)
- ابعاد با تغییر آهسته (Slowly Changing Dimensions)
Mechanisms
سیستمهای عملیاتی مانند پروندههای الکترونیکی سلامت برای تراکنشهای فردی سریع بهینه شدهاند، که آنها را برای پرسوجوهای تحلیلی بزرگ نامناسب میسازد. یک انبار داده بالینی با استخراج دورهای دادهها از این منابع، تبدیل و پاکسازی آنها، و بارگذاری آنها در یک مخزن جداگانه که برای تحلیل ساختار یافته است، این مشکل را برطرف میکند. دو سنت طراحی تأثیرگذار، لایه مدلسازی را شکل میدهند: رویکرد انبار سازمانی نرمالشده مرتبط با اینمون، و رویکرد طرح ستارهای ابعادی مرتبط با کیمبال، که دادهها را برای تجمیع کارآمد در جداول واقعیت و ابعاد سازماندهی میکند. در محیطهای تحقیقاتی، پلتفرمهایی مانند i2b2 دادههای بیمار را حول یک طرح ستارهای و یک هستیشناسی کنترلشده سازماندهی میکنند تا محققان بتوانند گروههای همگروه را پرسوجو کنند. نگاشت انبار به یک مدل داده مشترک امکان اجرای یک پرسوجو را در سراسر مؤسسات فراهم میکند.
Clinical relevance
معماری یک انبار داده بالینی شکل میدهد که چه تحلیلهایی امکانپذیر هستند و گروههای همگروه با چه دقتی قابل شناسایی هستند، که به نوبه خود بر اندازهگیری کیفیت و تحقیقاتی که مراقبت را شکل میدهند، تأثیر میگذارد. درک طراحی انبار به کاربران کمک میکند تا منشأ دادههای تحلیلی و تغییراتی که متحمل شدهاند را تفسیر کنند. این یک توصیف مرجع از زیرساخت است و راهنمایی بالینی فردی ارائه نمیدهد.
History
انبارهای داده در اواخر قرن بیستم در سیستمهای اطلاعاتی عمومی ظهور کردند، با مدل سازمانی نرمالشده اینمون و مدل ابعادی کیمبال که بحث اصلی طراحی را شکل دادند. مراقبتهای بهداشتی این الگوها را با انباشت دادههای قابل استفاده مجدد در پروندههای الکترونیکی پذیرفتند؛ پلتفرمهای تحقیقاتی مانند i2b2 در سال 2010 معماریهای انبار دادهای را نشان دادند که برای کشف گروههای بالینی طراحی شده بودند، و مدلهای داده مشترک بعدها پرسوجوهای بینمؤسسهای را استانداردسازی کردند.
Debates
- انبار سازمانی نرمالشده در مقابل مدلسازی ابعادی
- طراحان در مورد اینکه آیا یک انبار سازمانی نرمالشده و یکپارچه (سنت اینمون) بسازند که بازارهای داده از آن مشتق میشوند، یا مستقیماً بازارهای داده با طرح ستارهای ابعادی (سنت کیمبال) بسازند، اختلاف نظر دارند؛ این انتخاب بین یکپارچگی و انعطافپذیری در مقابل سادگی و سرعت پرسوجو معاوضه میکند.
Key figures
- William H. Inmon
- Ralph Kimball
- Shawn N. Murphy
- Isaac Kohane
Related topics
Seminal works
- inmon-2005
- kimball-ross-2013
- murphy-2010
Frequently asked questions
- چرا تحلیلها را مستقیماً روی پایگاه داده پرونده الکترونیکی سلامت اجرا نکنیم؟
- سیستمهای تراکنشی برای خواندن و نوشتنهای کوچک و متعدد که از مراقبت زنده پشتیبانی میکنند، تنظیم شدهاند، بنابراین پرسوجوهای تحلیلی بزرگ میتوانند آنها را کند کرده و خطر تأثیرگذاری بر عملیات بالینی را داشته باشند. یک انبار داده، تحلیل را از ارائه مراقبت جدا میکند و دادهها را برای پرسوجوی کارآمد ساختار میدهد.
- مدل داده مشترک چیست و چرا برای طراحی انبار داده اهمیت دارد؟
- مدل داده مشترک یک طرح و واژگان مشترک است که چندین مؤسسه برای انبارهای داده خود آن را اتخاذ میکنند. نگاشت به آن امکان میدهد که یک پرسوجوی تحلیلی مشابه بدون بازنویسی در سراسر سایتها اجرا شود، که از تحقیقات چندمؤسسهای و قابلیت تکرارپذیری پشتیبانی میکند.