Почему качество данных так сильно подчеркивается в аналитике здравоохранения?

Анализ наследует пробелы и предубеждения исходных данных, поэтому неполные, непоследовательные или плохо управляемые данные могут привести к вводящим в заблуждение результатам, независимо от сложности аналитического метода.

Заменяет ли машинное обучение клиническое или эпидемиологическое мышление?

Нет; машинное обучение может находить сложные закономерности, но не устанавливает причинно-следственную связь и не гарантирует переносимость на новые популяции, поэтому оно дополняет, а не заменяет валидацию, причинно-следственное мышление и клиническое суждение.

Управление и анализ данных здравоохранения

Управление и анализ данных здравоохранения охватывают методы организации, регулирования и обеспечения качества медицинских данных, а также их последующего анализа для поддержки клинических, операционных решений и решений в области общественного здравоохранения. Это включает в себя широкий спектр задач: от создания хранилищ данных и управления ими до описательной отчетности, прогностического моделирования и использования машинного обучения на больших массивах клинических данных.

Найти тему в PaperMindСкороFind papers & topics

Tools & resources

Скачать слайды

Learn & explore

ВидеоСкоро

Definition

Управление и анализ данных здравоохранения — это совокупность практик по сбору, интеграции, регулированию и обеспечению качества медицинских данных, а также по их анализу — описательному, прогностическому или с помощью машинного обучения — для информирования клинических, операционных решений и решений в области общественного здравоохранения.

Scope

Эта тема охватывает основы управления данными, такие как интеграция, управление и качество; аналитический спектр от описательных до прогностических методов; а также возможности и ограничения применения методов больших данных и машинного обучения к данным здравоохранения. Она представлена как концептуальный справочник; она не одобряет конкретные инструменты, модели или аналитические решения для какой-либо конкретной ситуации и не предлагает клинических рекомендаций.

Core questions

Как медицинские данные интегрируются, регулируются и обеспечивается их качество перед анализом?
Каков спектр от описательной отчетности до прогностической аналитики?
Что могут привнести методы машинного обучения и больших данных в здравоохранение, и каковы их ограничения?
Как аналитические модели на основе клинических данных валидируются и ответственно интерпретируются?

Key concepts

Управление данными и их администрирование
Качество и полнота данных
Интеграция и хранение данных
Описательная, прогностическая и предписывающая аналитика
Машинное обучение на клинических данных
Модели прогнозирования рисков
Валидация модели и обобщаемость

Mechanisms

Анализ прежде всего зависит от управления: данные из множества источников интегрируются, регулируются и оцениваются на предмет качества и полноты, поскольку анализ наследует предубеждения и пробелы своих входных данных. Аналитические методы затем охватывают описательные сводки, прогностические модели и подходы машинного обучения, которые выявляют закономерности в больших наборах данных. Модели, построенные на основе рутинно собираемых клинических данных, сталкиваются с повторяющимися методологическими проблемами — пропущенными данными, смешивающими факторами (confounding) и ограниченной внешней валидацией, — поэтому подчеркивается важность обобщаемости и тщательной интерпретации. Машинное обучение может выявлять сложные закономерности, но само по себе не устанавливает причинно-следственную связь и не гарантирует применимость модели к новым популяциям.

Clinical relevance

Анализ данных здравоохранения может служить основой для измерения качества, планирования ресурсов и стратификации рисков, а также все чаще используется в инструментах поддержки принятия решений. Эта статья описывает методы и их ограничения в качестве справочного материала; она не рекомендует конкретные модели или аналитические действия, а аналитические результаты не заменяют клинического суждения.

Evidence & guidelines

Доказательства здесь носят методологический и концептуальный характер: комментарии по применению больших данных, обзорные статьи по машинному обучению в медицине и систематические обзоры разработки прогностических моделей на основе данных записей. Эти работы последовательно подчеркивают качество данных, валидацию и осторожную интерпретацию, а не предлагают клинические рекомендации.

History

Аналитика здравоохранения развивалась от административной отчетности и реестров к интегрированным хранилищам данных и, с распространением электронных записей, к большим многократно используемым клиническим наборам данных. Комментарии в 2010-х годах предвосхищали неизбежное применение больших данных в здравоохранении, а последующие обзоры описывали как перспективы машинного обучения, так и повторяющиеся проблемы качества данных, валидации и обобщаемости, которые его ограничивают.

Debates

Можно ли доверять моделям, обученным на рутинных клинических данных, в различных условиях?: Прогностические модели и модели машинного обучения часто хорошо работают на этапе разработки, но их эффективность снижается в новых популяциях из-за различий в сборе данных, составе случаев и качестве; рецензенты подчеркивают важность внешней валидации и предостерегают от чрезмерной интерпретации аналитики больших данных.

Key figures

Isaac Kohane
Andrew Beam
Ziad Obermeyer
Alvin Rajkomar
Benjamin Goldstein

Seminal works

murdoch-2013
beam-2018
rajkomar-2019

Frequently asked questions

Почему качество данных так сильно подчеркивается в аналитике здравоохранения?: Анализ наследует пробелы и предубеждения исходных данных, поэтому неполные, непоследовательные или плохо управляемые данные могут привести к вводящим в заблуждение результатам, независимо от сложности аналитического метода.
Заменяет ли машинное обучение клиническое или эпидемиологическое мышление?: Нет; машинное обучение может находить сложные закономерности, но не устанавливает причинно-следственную связь и не гарантирует переносимость на новые популяции, поэтому оно дополняет, а не заменяет валидацию, причинно-следственное мышление и клиническое суждение.