医疗保健数据管理与分析
医疗保健数据管理与分析是健康信息学领域的一个分支,关注临床、行政和公共卫生系统生成的数据如何存储、整合、治理并转化为有用知识。它涵盖了整合异构健康数据的存储库工程、确保数据可信度的学科以及挖掘数据以回答有关有效性、人群和操作问题的分析方法。
Definition
医疗保健数据管理与分析是一套组织健康相关数据并对其应用统计、计算和数据挖掘技术的方法和基础设施,旨在在研究、人群和卫生系统层面生成证据并支持决策。
Scope
本领域旨在引导读者了解健康数据的生命周期:捕获与整合、在临床数据仓库中的存储、治理与质量保证,以及用于研究、人群测量和操作的下游分析。它汇集了五个主题,从基础设施(仓库设计)到管理(治理和质量)再到使用(比较有效性、人群健康和大数据应用)。它是一个参考性概述,而非构建指南或临床决策工具。
Sub-topics
Key concepts
- 临床数据仓库
- 数据整合与抽取-转换-加载 (ETL)
- 通用数据模型
- 数据治理与管理
- 数据质量维度
- 临床数据的次级使用
- 比较有效性研究
- 人群健康测量
- 大数据分析
- 预测建模与数据挖掘
Mechanisms
健康数据来源于电子健康记录、理赔系统、注册表、设备和监测馈送。为了可重用,这些异构数据流被提取、转换并加载到集成存储库中,例如临床数据仓库,通常映射到通用数据模型,以便查询可以在不同机构之间移植。治理结构对数据分配责任,质量评估在数据分析之前评估完整性、正确性和合理性等维度。分析方法则从描述性测量到数据挖掘和预测建模,分析问题决定了哪种设计和哪些数据是合适的。
Clinical relevance
此处描述的基础设施和分析方法支撑了医疗保健中使用的许多次级证据,包括质量测量、比较有效性研究和人群监测。理解它们有助于临床医生和研究人员判断数据衍生证据是如何产生的以及其局限性。本领域描述了证据和决策支持是如何生成的;它本身并非个体诊断或治疗说明的来源。
History
随着电子健康记录和行政系统积累了大量常规收集的数据,关注点从主要数据捕获转向这些数据的次级用途,用于研究和管理。建立可共享研究存储库的举措,例如i2b2平台,以及2010年代医疗保健领域大数据分析的增长,使数据管理和分析成为健康信息学的一个独立分支,拥有其自身的质量、治理和可重复性关注点。
Key figures
- David W. Bates
- Shawn N. Murphy
- Isaac Kohane
Related topics
Seminal works
- murphy-2010
- weiskopf-weng-2013
- bates-2014
Frequently asked questions
- 健康数据管理与健康数据分析有何区别?
- 数据管理涵盖健康数据如何被捕获、整合、存储和治理,以确保其可信和可重用;分析涵盖应用于这些数据以产生知识的统计和计算方法。两者相互依存:分析的可靠性取决于底层数据的管理和质量。
- 临床数据的“次级使用”意味着什么?
- 它指的是将最初为临床护理或计费而收集的数据用于其他目的,例如研究、质量测量或人群监测。由于这些数据并非为此类目的而收集,因此治理和质量评估对于负责任地使用它们至关重要。