ScholarGate
어시스턴트

임상 데이터 웨어하우스 설계 및 아키텍처

임상 데이터 웨어하우스는 건강 시스템의 트랜잭션 소스에서 데이터를 통합하여 운영 케어 시스템을 방해하지 않고 분석할 수 있도록 하는 통합된 쿼리 지향 저장소입니다. 그 설계와 아키텍처는 연구, 품질 측정 및 운영 보고를 위해 원본 데이터가 추출, 모델링 및 노출되는 방식을 결정합니다.

PaperMind(으)로 주제 찾기곧 제공Find papers & topics
Tools & resources
슬라이드 다운로드
Learn & explore
동영상곧 제공

Definition

임상 데이터 웨어하우스 설계는 여러 운영 소스에서 건강 데이터를 통합하여 트랜잭션 케어보다는 쿼리, 분석 및 재사용에 최적화된 구조로 만드는 통합 저장소의 아키텍처 및 엔지니어링입니다.

Scope

이 주제는 임상 데이터 웨어하우스의 아키텍처 패턴을 다룹니다: 분석 시스템과 트랜잭션 시스템의 분리, 추출-변환-적재(ETL) 파이프라인, 차원 모델링 대 정규화 모델링, 그리고 쿼리 이식성을 위한 공통 데이터 모델의 사용. 이는 웨어하우스 설계를 특정 플랫폼에 대한 운영 지침이 아닌 정보학 및 데이터 엔지니어링 주제로 다룹니다.

Key concepts

  • 분석 및 트랜잭션(OLAP 대 OLTP) 워크로드의 분리
  • 추출-변환-적재(ETL) 파이프라인
  • 차원 모델링(스타 및 스노우플레이크 스키마)
  • 정규화된(제3정규형) 엔터프라이즈 웨어하우스 설계
  • 공통 데이터 모델
  • 데이터 마트
  • 메타데이터 및 데이터 계보
  • 느리게 변하는 차원

Mechanisms

전자 건강 기록과 같은 운영 시스템은 빠른 개별 트랜잭션에 최적화되어 있어 대규모 분석 쿼리에는 적합하지 않습니다. 임상 데이터 웨어하우스는 이러한 소스에서 데이터를 주기적으로 추출하고, 변환 및 정제한 다음, 분석에 적합하게 구조화된 별도의 저장소에 로드함으로써 이 문제를 해결합니다. 두 가지 영향력 있는 설계 전통이 모델링 계층에 정보를 제공합니다: Inmon과 관련된 정규화된 엔터프라이즈 웨어하우스 접근 방식과 Kimball과 관련된 차원 스타 스키마 접근 방식은 효율적인 집계를 위해 데이터를 팩트 및 차원 테이블로 구성합니다. 연구 환경에서 i2b2와 같은 플랫폼은 스타 스키마와 통제된 온톨로지를 중심으로 환자 데이터를 구성하여 연구자들이 코호트를 쿼리할 수 있도록 합니다. 웨어하우스를 공통 데이터 모델에 매핑하면 동일한 쿼리가 여러 기관에서 실행될 수 있습니다.

Clinical relevance

임상 데이터 웨어하우스의 아키텍처는 어떤 분석이 가능한지, 코호트를 얼마나 신뢰성 있게 식별할 수 있는지를 결정하며, 이는 다시 품질 측정 및 진료에 정보를 제공하는 연구에 영향을 미칩니다. 웨어하우스 설계를 이해하는 것은 사용자가 분석 데이터의 출처와 어떤 변환을 거쳤는지 해석하는 데 도움이 됩니다. 이는 인프라에 대한 참조 설명이며 개별 임상 지침을 제공하지 않습니다.

History

데이터 웨어하우징은 20세기 후반 일반 정보 시스템에서 등장했으며, Inmon의 정규화된 엔터프라이즈 모델과 Kimball의 차원 모델이 주요 설계 논쟁의 틀을 형성했습니다. 의료 분야는 재사용 가능한 데이터가 축적됨에 따라 이러한 패턴을 채택했습니다. 2010년 i2b2와 같은 연구 지향 플랫폼은 임상 코호트 발견에 맞춤화된 웨어하우스 아키텍처를 시연했으며, 이후 공통 데이터 모델은 기관 간 쿼리를 표준화했습니다.

Debates

정규화된 엔터프라이즈 웨어하우스 대 차원 모델링
설계자들은 데이터 마트가 파생되는 정규화되고 통합된 엔터프라이즈 웨어하우스(Inmon 전통)를 구축할 것인지, 아니면 차원 스타 스키마 마트를 직접 구축할 것인지(Kimball 전통)에 대해 의견이 다릅니다. 이 선택은 통합 및 유연성과 쿼리 단순성 및 속도를 맞바꾸는 것입니다.

Key figures

  • William H. Inmon
  • Ralph Kimball
  • Shawn N. Murphy
  • Isaac Kohane

Related topics

Seminal works

  • inmon-2005
  • kimball-ross-2013
  • murphy-2010

Frequently asked questions

전자 건강 기록 데이터베이스에서 직접 분석을 실행하면 안 되는 이유는 무엇입니까?
트랜잭션 시스템은 실시간 진료를 지원하는 많은 작은 읽기 및 쓰기에 최적화되어 있으므로, 대규모 분석 쿼리는 시스템 속도를 저하시키고 임상 운영에 영향을 미칠 위험이 있습니다. 데이터 웨어하우스는 분석을 진료 제공과 분리하고 효율적인 쿼리를 위해 데이터를 구조화합니다.
공통 데이터 모델이란 무엇이며 웨어하우스 설계에 왜 중요합니까?
공통 데이터 모델은 여러 기관이 웨어하우스에 채택하는 공유 스키마 및 어휘입니다. 이에 매핑하면 동일한 분석 쿼리를 다시 작성할 필요 없이 여러 사이트에서 실행할 수 있어 다기관 연구 및 재현성을 지원합니다.

Methods for this concept

Related concepts