چه چیزی دادههای سلامت را «کلانداده» میکند؟

دادههای سلامت اغلب زمانی کلانداده توصیف میشوند که حجم زیادی داشته باشند، به سرعت وارد شوند یا تغییر کنند (سرعت)، و انواع ناهمگن و بدون ساختار زیادی را ترکیب کنند (تنوع)، تا حدی که ابزارهای مرسوم تکماشینی نتوانند به راحتی آنها را ذخیره یا تحلیل کنند.

آیا یک مجموعهداده سلامت بزرگتر همیشه قابل اعتمادتر است؟

خیر. مقیاس میتواند توانایی تشخیص الگوها را بهبود بخشد، اما اگر دادهها غیرنماینده یا با کیفیت پایین باشند، مجموعهدادههای بزرگ میتوانند سوگیری را تقویت کنند. نتایج قابل اعتماد به کیفیت داده، نمایندگی، اعتبارسنجی و قابلیت همکاری بستگی دارد، نه فقط به اندازه.

فناوری‌های کلان‌داده و کاربردهای آن در مراقبت‌های بهداشتی

کلان‌داده در مراقبت‌های بهداشتی به مجموعه‌داده‌هایی اشاره دارد که حجم، سرعت و تنوع آن‌ها از ظرفیت ابزارهای مدیریت داده‌های مرسوم فراتر می‌رود، و همچنین به فناوری‌های توزیع‌شده‌ای که برای ذخیره و تحلیل آن‌ها توسعه یافته‌اند. کاربردها شامل داده‌های بالینی، ژنومی، اداری و حسگرها می‌شود، که هدف از آن‌ها استخراج الگوها و پیش‌بینی‌هایی است که مجموعه‌داده‌های کوچک‌تر یا تک‌منبعی قادر به پشتیبانی از آن‌ها نیستند.

یافتن موضوع با PaperMindبه‌زودیFind papers & topics

Tools & resources

دریافت اسلایدها

Learn & explore

ویدیوبه‌زودی

Definition

فناوری‌های کلان‌داده در مراقبت‌های بهداشتی، روش‌های ذخیره‌سازی و تحلیل توزیع‌شده‌ای هستند که برای مجموعه‌داده‌های مرتبط با سلامت با حجم، سرعت و تنوع بالا طراحی شده‌اند و برای پشتیبانی از پیش‌بینی، کشف و مدیریت در داده‌های بالینی، ژنومی، اداری و تولید شده توسط دستگاه‌ها به کار می‌روند.

Scope

این موضوع به ویژگی‌های تعریف‌کننده کلان‌داده در حوزه سلامت، رویکردهای فناورانه برای مدیریت داده‌ها در مقیاس بزرگ، و کاربردهای نماینده در مراقبت‌های بهداشتی مانند تحلیل‌های پیش‌بینی‌کننده و مدیریت جمعیت‌های پرخطر می‌پردازد. همچنین به محدودیت‌ها و خطرات این رویکردها اشاره می‌کند. این یک مرور کلی مرجع از روش‌ها و کاربردها است، نه راهنمای پیاده‌سازی یا بالینی.

Key concepts

حجم، سرعت و تنوع («سه V»)
ذخیره‌سازی و پردازش توزیع‌شده
داده‌های ناهمگن و بدون ساختار
تحلیل‌های پیش‌بینی‌کننده
یادگیری ماشین در پزشکی
داده‌های ژنومی و حسگر
مقیاس‌پذیری و قابلیت همکاری
قابلیت تعمیم و سوگیری در مجموعه‌داده‌های بزرگ

Mechanisms

داده‌های سلامت با انباشت سوابق الکترونیکی، تصویربرداری، ژنومیک، ادعاها و حسگرهای پوشیدنی، از نظر مقیاس و ناهمگونی رشد کرده‌اند. رویکردهای کلان‌داده با توزیع ذخیره‌سازی و محاسبات در میان بسیاری از ماشین‌ها و با تطبیق داده‌های ساختاریافته و بدون ساختار با یکدیگر، به این موضوع می‌پردازند. هنگامی که داده‌ها در مقیاس بزرگ قرار می‌گیرند، روش‌های تحلیلی، که به طور فزاینده‌ای شامل یادگیری ماشین می‌شوند، برای شناسایی الگوها و ساخت پیش‌بینی‌ها، مانند شناسایی بیماران پرخطر یا پرهزینه برای مدیریت هدفمند، به کار می‌روند. ارزش این روش‌ها به کیفیت داده‌ها، نمایندگی و قابلیت همکاری بستگی دارد؛ مجموعه‌داده‌های بزرگ به خودی خود نتایج معتبری را تضمین نمی‌کنند و در صورت سوگیری داده‌های زیربنایی، می‌توانند سوگیری را تقویت کنند.

Clinical relevance

فناوری‌های کلان‌داده زیربنای ابزارهای پیش‌بینی‌کننده، مدل‌های خطر و سیستم‌های پشتیبانی تصمیم‌گیری هستند که به طور فزاینده‌ای در ارائه مراقبت‌های بهداشتی و تحقیقات استفاده می‌شوند. درک ویژگی‌ها و محدودیت‌های آن‌ها به کاربران کمک می‌کند تا قضاوت کنند چه زمانی تحلیل‌های در مقیاس بزرگ ارزش افزوده دارند و چه زمانی مقیاس، سوگیری یا کیفیت پایین داده‌ها را پنهان می‌کند. این موضوع به توصیف فناوری‌ها و کاربردها می‌پردازد؛ و به تشخیص یا درمان فردی دستور نمی‌دهد.

History

با گسترش داده‌های سلامت که به طور معمول در اوایل دهه ۲۰۱۰ جمع‌آوری می‌شدند، مفهوم کلان‌داده، که در ابتدا حول حجم، سرعت و تنوع در سیستم‌های اطلاعاتی شکل گرفته بود، به مراقبت‌های بهداشتی اعمال شد. بررسی‌ها، نوید آن را برای استفاده بالینی، ژنومی و عملیاتی ترسیم کردند، و تحلیل‌ها برای مدیریت جمعیت‌های پرخطر کاربردهای ملموسی را نشان دادند. ظهور بعدی یادگیری ماشین در پزشکی بر اساس این مجموعه‌داده‌های بزرگ بنا شد، در حالی که توجه به سوگیری، اعتبارسنجی و قابلیت تعمیم را افزایش داد.

Debates

آیا داده‌های بیشتر به طور خودکار به معنای شواهد بهتر در مراقبت‌های بهداشتی است؟: اشتیاق به کلان‌داده با این نگرانی تعدیل می‌شود که مقیاس می‌تواند سوگیری را به جای غلبه بر آن، تثبیت کند، به خصوص زمانی که داده‌های زیربنایی غیرنماینده یا با کیفیت پایین باشند؛ بررسی‌ها تأکید می‌کنند که حجم باید با کیفیت داده، اعتبارسنجی و قابلیت همکاری همراه باشد تا نتایج قابل اعتمادی به دست آید.

Key figures

David W. Bates
Alvin Rajkomar
Isaac Kohane

Seminal works

raghupathi-2014
bates-2014

Frequently asked questions

چه چیزی داده‌های سلامت را «کلان‌داده» می‌کند؟: داده‌های سلامت اغلب زمانی کلان‌داده توصیف می‌شوند که حجم زیادی داشته باشند، به سرعت وارد شوند یا تغییر کنند (سرعت)، و انواع ناهمگن و بدون ساختار زیادی را ترکیب کنند (تنوع)، تا حدی که ابزارهای مرسوم تک‌ماشینی نتوانند به راحتی آن‌ها را ذخیره یا تحلیل کنند.
آیا یک مجموعه‌داده سلامت بزرگ‌تر همیشه قابل اعتمادتر است؟: خیر. مقیاس می‌تواند توانایی تشخیص الگوها را بهبود بخشد، اما اگر داده‌ها غیرنماینده یا با کیفیت پایین باشند، مجموعه‌داده‌های بزرگ می‌توانند سوگیری را تقویت کنند. نتایج قابل اعتماد به کیفیت داده، نمایندگی، اعتبارسنجی و قابلیت همکاری بستگی دارد، نه فقط به اندازه.