فناوریهای کلانداده و کاربردهای آن در مراقبتهای بهداشتی
کلانداده در مراقبتهای بهداشتی به مجموعهدادههایی اشاره دارد که حجم، سرعت و تنوع آنها از ظرفیت ابزارهای مدیریت دادههای مرسوم فراتر میرود، و همچنین به فناوریهای توزیعشدهای که برای ذخیره و تحلیل آنها توسعه یافتهاند. کاربردها شامل دادههای بالینی، ژنومی، اداری و حسگرها میشود، که هدف از آنها استخراج الگوها و پیشبینیهایی است که مجموعهدادههای کوچکتر یا تکمنبعی قادر به پشتیبانی از آنها نیستند.
Definition
فناوریهای کلانداده در مراقبتهای بهداشتی، روشهای ذخیرهسازی و تحلیل توزیعشدهای هستند که برای مجموعهدادههای مرتبط با سلامت با حجم، سرعت و تنوع بالا طراحی شدهاند و برای پشتیبانی از پیشبینی، کشف و مدیریت در دادههای بالینی، ژنومی، اداری و تولید شده توسط دستگاهها به کار میروند.
Scope
این موضوع به ویژگیهای تعریفکننده کلانداده در حوزه سلامت، رویکردهای فناورانه برای مدیریت دادهها در مقیاس بزرگ، و کاربردهای نماینده در مراقبتهای بهداشتی مانند تحلیلهای پیشبینیکننده و مدیریت جمعیتهای پرخطر میپردازد. همچنین به محدودیتها و خطرات این رویکردها اشاره میکند. این یک مرور کلی مرجع از روشها و کاربردها است، نه راهنمای پیادهسازی یا بالینی.
Key concepts
- حجم، سرعت و تنوع («سه V»)
- ذخیرهسازی و پردازش توزیعشده
- دادههای ناهمگن و بدون ساختار
- تحلیلهای پیشبینیکننده
- یادگیری ماشین در پزشکی
- دادههای ژنومی و حسگر
- مقیاسپذیری و قابلیت همکاری
- قابلیت تعمیم و سوگیری در مجموعهدادههای بزرگ
Mechanisms
دادههای سلامت با انباشت سوابق الکترونیکی، تصویربرداری، ژنومیک، ادعاها و حسگرهای پوشیدنی، از نظر مقیاس و ناهمگونی رشد کردهاند. رویکردهای کلانداده با توزیع ذخیرهسازی و محاسبات در میان بسیاری از ماشینها و با تطبیق دادههای ساختاریافته و بدون ساختار با یکدیگر، به این موضوع میپردازند. هنگامی که دادهها در مقیاس بزرگ قرار میگیرند، روشهای تحلیلی، که به طور فزایندهای شامل یادگیری ماشین میشوند، برای شناسایی الگوها و ساخت پیشبینیها، مانند شناسایی بیماران پرخطر یا پرهزینه برای مدیریت هدفمند، به کار میروند. ارزش این روشها به کیفیت دادهها، نمایندگی و قابلیت همکاری بستگی دارد؛ مجموعهدادههای بزرگ به خودی خود نتایج معتبری را تضمین نمیکنند و در صورت سوگیری دادههای زیربنایی، میتوانند سوگیری را تقویت کنند.
Clinical relevance
فناوریهای کلانداده زیربنای ابزارهای پیشبینیکننده، مدلهای خطر و سیستمهای پشتیبانی تصمیمگیری هستند که به طور فزایندهای در ارائه مراقبتهای بهداشتی و تحقیقات استفاده میشوند. درک ویژگیها و محدودیتهای آنها به کاربران کمک میکند تا قضاوت کنند چه زمانی تحلیلهای در مقیاس بزرگ ارزش افزوده دارند و چه زمانی مقیاس، سوگیری یا کیفیت پایین دادهها را پنهان میکند. این موضوع به توصیف فناوریها و کاربردها میپردازد؛ و به تشخیص یا درمان فردی دستور نمیدهد.
History
با گسترش دادههای سلامت که به طور معمول در اوایل دهه ۲۰۱۰ جمعآوری میشدند، مفهوم کلانداده، که در ابتدا حول حجم، سرعت و تنوع در سیستمهای اطلاعاتی شکل گرفته بود، به مراقبتهای بهداشتی اعمال شد. بررسیها، نوید آن را برای استفاده بالینی، ژنومی و عملیاتی ترسیم کردند، و تحلیلها برای مدیریت جمعیتهای پرخطر کاربردهای ملموسی را نشان دادند. ظهور بعدی یادگیری ماشین در پزشکی بر اساس این مجموعهدادههای بزرگ بنا شد، در حالی که توجه به سوگیری، اعتبارسنجی و قابلیت تعمیم را افزایش داد.
Debates
- آیا دادههای بیشتر به طور خودکار به معنای شواهد بهتر در مراقبتهای بهداشتی است؟
- اشتیاق به کلانداده با این نگرانی تعدیل میشود که مقیاس میتواند سوگیری را به جای غلبه بر آن، تثبیت کند، به خصوص زمانی که دادههای زیربنایی غیرنماینده یا با کیفیت پایین باشند؛ بررسیها تأکید میکنند که حجم باید با کیفیت داده، اعتبارسنجی و قابلیت همکاری همراه باشد تا نتایج قابل اعتمادی به دست آید.
Key figures
- David W. Bates
- Alvin Rajkomar
- Isaac Kohane
Related topics
Seminal works
- raghupathi-2014
- bates-2014
Frequently asked questions
- چه چیزی دادههای سلامت را «کلانداده» میکند؟
- دادههای سلامت اغلب زمانی کلانداده توصیف میشوند که حجم زیادی داشته باشند، به سرعت وارد شوند یا تغییر کنند (سرعت)، و انواع ناهمگن و بدون ساختار زیادی را ترکیب کنند (تنوع)، تا حدی که ابزارهای مرسوم تکماشینی نتوانند به راحتی آنها را ذخیره یا تحلیل کنند.
- آیا یک مجموعهداده سلامت بزرگتر همیشه قابل اعتمادتر است؟
- خیر. مقیاس میتواند توانایی تشخیص الگوها را بهبود بخشد، اما اگر دادهها غیرنماینده یا با کیفیت پایین باشند، مجموعهدادههای بزرگ میتوانند سوگیری را تقویت کنند. نتایج قابل اعتماد به کیفیت داده، نمایندگی، اعتبارسنجی و قابلیت همکاری بستگی دارد، نه فقط به اندازه.
Methods for this concept
- Hospital Readmission Prediction Model
- Real-World Evidence Studies
- Machine learning-assisted copy number variation analysis
- Digital Health Acceptance Scale
- Data Protection and Privacy in Research
- Data Warehousing
- Machine learning-assisted microbiome diversity analysis
- Machine learning-assisted pathway enrichment analysis