건강 데이터 거버넌스 및 데이터 품질
건강 데이터 거버넌스는 누가, 어떤 목적으로, 어떤 통제 하에 건강 데이터에 접근할 수 있는지를 결정하는 정책, 역할 및 책임의 집합이며, 데이터 품질은 해당 데이터가 의도된 용도에 얼마나 적합한지를 나타내는 정도입니다. 이 둘은 일상적으로 수집된 건강 데이터를 기반으로 구축된 분석 결과가 신뢰할 수 있는지 여부를 함께 결정합니다.
Definition
건강 데이터 거버넌스는 건강 데이터의 관리 및 사용에 대한 책임, 정책 및 통제의 프레임워크인 반면, 데이터 품질 평가는 해당 데이터가 특정 분석 목적에 충분히 완전하고 정확하며 타당한지 여부를 체계적으로 평가하는 것입니다.
Scope
이 주제는 건강 데이터를 관리하는 관리 구조와 완전성, 정확성, 타당성을 포함하여 데이터 품질을 평가하는 데 사용되는 차원 및 방법을 다룹니다. 또한 임상 데이터의 2차 사용에 명시적인 거버넌스 및 품질 평가가 필요한 이유를 설명합니다. 이는 방법론 및 원칙에 대한 참조 자료이며, 특정 관할권에 대한 법률, 규제 또는 규정 준수 조언이 아닙니다.
Key concepts
- 데이터 관리 및 책임
- 데이터 품질 차원 (완전성, 정확성, 타당성)
- 사용 적합성
- 임상 데이터의 2차 사용
- 조화된 데이터 품질 용어
- FAIR 원칙 (찾을 수 있는, 접근 가능한, 상호 운용 가능한, 재사용 가능한)
- 출처 및 데이터 계보
- 접근 제어 및 데이터 사용 계약
Mechanisms
임상 및 행정 데이터는 연구 목적이 아닌 진료 및 청구를 위해 수집되므로, 재사용을 위해서는 거버넌스와 품질 관리가 모두 필요합니다. 거버넌스는 관리 책임을 할당합니다. 즉, 정의된 역할이 접근 권한, 허용 가능한 사용 및 보호 조치를 결정하고 데이터 사용 계약을 문서화합니다. 그런 다음 품질 평가는 작업 관련 차원에 따라 데이터를 평가합니다. 전자 건강 기록 데이터 품질에 대한 검토는 이를 완전성, 정확성, 일치성, 타당성 및 최신성과 같은 반복적인 차원으로 정리했으며, 이후 조화 작업은 기관들이 품질을 일관되게 설명할 수 있도록 공유 용어를 제안했습니다. FAIR과 같은 관리 원칙은 데이터가 찾을 수 있고(findable), 접근 가능하며(accessible), 상호 운용 가능하고(interoperable), 재사용 가능해야(reusable) 함을 강조하며, 이는 데이터가 어떻게 조직되고 공유되는지를 다룸으로써 품질 평가를 보완합니다.
Clinical relevance
거버넌스와 품질은 일상적으로 수집된 데이터에서 파생된 증거가 신뢰할 수 있는지 여부를 결정합니다. 예측 모델링에 대한 체계적인 검토에서 지적했듯이, 낮은 데이터 품질은 진료 결정에 영향을 미치는 위험 예측 모델 및 품질 측정에 편향을 유발할 수 있습니다. 이러한 방법을 이해하는 것은 사용자가 데이터 기반 결과의 신뢰성을 판단하는 데 도움이 됩니다. 이 주제는 관리 및 평가 원칙을 설명하며, 규제, 개인 정보 보호 또는 규정 준수 지침을 구성하지 않습니다.
History
임상 데이터의 2차 사용이 증가함에 따라, 통제되지 않고 평가되지 않은 데이터가 오해를 불러일으킬 수 있다는 점이 인식되었습니다. 2010년대에는 체계적인 검토를 통해 전자 건강 기록 데이터 품질의 차원이 분류되었고, 조화 노력은 사용 적합성을 평가하기 위한 공유 용어 및 프레임워크를 제안했으며, FAIR 원칙은 연구 데이터에 대한 더 광범위한 관리 기대를 명확히 했습니다. 이러한 발전은 거버넌스와 품질을 신뢰할 수 있는 건강 분석의 전제 조건으로 확립했습니다.
Debates
- 데이터 품질은 고유한 속성인가, 아니면 사용에 상대적인가?
- 데이터 품질이 절대적으로 판단될 수 있는지, 아니면 특정 분석 목적에 대해서만 판단될 수 있는지에 대한 반복적인 논쟁이 있습니다. 지배적인 견해는 품질을 사용 적합성으로 간주하며, 이는 한 분석에 적합한 데이터가 다른 분석에는 부적합할 수 있음을 의미하여 보편적인 품질 표준을 복잡하게 만듭니다.
Key figures
- Nicole Weiskopf
- Chunhua Weng
- Michael Kahn
- Mark Wilkinson
Related topics
Seminal works
- weiskopf-weng-2013
- kahn-2016
- wilkinson-2016
Frequently asked questions
- 건강 데이터 품질의 일반적인 차원은 무엇입니까?
- 전자 건강 기록 데이터 품질에 대한 검토는 일반적으로 완전성, 정확성 또는 정밀성, 일치성, 타당성 및 최신성과 같은 차원을 설명합니다. 관련 차원은 데이터의 의도된 분석 용도에 따라 달라집니다.
- 데이터 거버넌스는 데이터 품질과 어떻게 다릅니까?
- 거버넌스는 권한과 책임에 관한 것입니다. 즉, 누가 데이터를 통제하고 데이터 사용이 어떻게 허용되고 보호되는지에 관한 것입니다. 데이터 품질은 데이터의 사용 적합성에 관한 것입니다. 좋은 거버넌스는 품질이 유지되고 평가될 수 있는 조건을 조성합니다.