ScholarGate
Trợ lý

Thiết kế và Kiến trúc Kho dữ liệu Lâm sàng

Kho dữ liệu lâm sàng là một kho lưu trữ tích hợp, định hướng truy vấn, hợp nhất dữ liệu từ các nguồn giao dịch của hệ thống y tế để có thể phân tích mà không làm gián đoạn các hệ thống chăm sóc hoạt động. Thiết kế và kiến trúc của nó quyết định cách dữ liệu nguồn được trích xuất, mô hình hóa và hiển thị cho nghiên cứu, đo lường chất lượng và báo cáo hoạt động.

Tìm chủ đề với PaperMindSắp ra mắtFind papers & topics
Tools & resources
Tải xuống bản trình chiếu
Learn & explore
VideoSắp ra mắt

Definition

Thiết kế kho dữ liệu lâm sàng là kiến trúc và kỹ thuật của các kho lưu trữ tích hợp, hợp nhất dữ liệu sức khỏe từ nhiều nguồn hoạt động thành một cấu trúc được tối ưu hóa cho việc truy vấn, phân tích và tái sử dụng hơn là cho chăm sóc giao dịch.

Scope

Chủ đề này bao gồm các mẫu kiến trúc đằng sau các kho dữ liệu lâm sàng: sự tách biệt giữa hệ thống phân tích và hệ thống giao dịch, các đường ống trích xuất-chuyển đổi-tải (ETL), mô hình hóa chiều so với mô hình hóa chuẩn hóa, và việc sử dụng các mô hình dữ liệu chung để làm cho các truy vấn có thể di động. Nó coi thiết kế kho dữ liệu là một chủ đề tin học và kỹ thuật dữ liệu, không phải là hướng dẫn vận hành cho bất kỳ nền tảng cụ thể nào.

Key concepts

  • Tách biệt khối lượng công việc phân tích và giao dịch (OLAP so với OLTP)
  • Đường ống trích xuất-chuyển đổi-tải (ETL)
  • Mô hình hóa chiều (lược đồ sao và bông tuyết)
  • Thiết kế kho dữ liệu doanh nghiệp chuẩn hóa (dạng chuẩn thứ ba)
  • Các mô hình dữ liệu chung
  • Kho dữ liệu con (Data marts)
  • Siêu dữ liệu và nguồn gốc dữ liệu
  • Các chiều thay đổi chậm

Mechanisms

Các hệ thống hoạt động như hồ sơ sức khỏe điện tử được tối ưu hóa cho các giao dịch cá nhân nhanh chóng, điều này khiến chúng không phù hợp với các truy vấn phân tích lớn. Một kho dữ liệu lâm sàng giải quyết vấn đề này bằng cách định kỳ trích xuất dữ liệu từ các nguồn đó, chuyển đổi và làm sạch chúng, sau đó tải chúng vào một kho lưu trữ riêng biệt được cấu trúc để phân tích. Hai truyền thống thiết kế có ảnh hưởng thông báo lớp mô hình hóa: phương pháp kho dữ liệu doanh nghiệp chuẩn hóa liên quan đến Inmon, và phương pháp lược đồ sao chiều liên quan đến Kimball, tổ chức dữ liệu thành các bảng sự kiện và chiều để tổng hợp hiệu quả. Trong các môi trường nghiên cứu, các nền tảng như i2b2 tổ chức dữ liệu bệnh nhân xung quanh một lược đồ sao và một bản thể luận được kiểm soát để các nhà điều tra có thể truy vấn các nhóm đối tượng. Ánh xạ kho dữ liệu vào một mô hình dữ liệu chung cho phép cùng một truy vấn chạy trên nhiều tổ chức.

Clinical relevance

Kiến trúc của một kho dữ liệu lâm sàng định hình những phân tích nào có thể thực hiện được và mức độ đáng tin cậy của việc xác định các nhóm đối tượng, điều này lần lượt ảnh hưởng đến việc đo lường chất lượng và nghiên cứu thông báo chăm sóc. Hiểu biết về thiết kế kho dữ liệu giúp người dùng diễn giải dữ liệu phân tích đến từ đâu và những chuyển đổi nào chúng đã trải qua. Đây là một mô tả tham chiếu về cơ sở hạ tầng và không cung cấp hướng dẫn lâm sàng cá nhân.

History

Kho dữ liệu xuất hiện trong các hệ thống thông tin chung vào cuối thế kỷ XX, với mô hình doanh nghiệp chuẩn hóa của Inmon và mô hình chiều của Kimball tạo nên cuộc tranh luận thiết kế chính. Chăm sóc sức khỏe đã áp dụng các mẫu này khi hồ sơ điện tử tích lũy dữ liệu có thể tái sử dụng; các nền tảng định hướng nghiên cứu như i2b2 vào năm 2010 đã chứng minh các kiến trúc kho dữ liệu được điều chỉnh để khám phá nhóm đối tượng lâm sàng, và các mô hình dữ liệu chung sau đó đã chuẩn hóa việc truy vấn liên tổ chức.

Debates

Kho dữ liệu doanh nghiệp chuẩn hóa so với mô hình hóa chiều
Các nhà thiết kế khác nhau về việc xây dựng một kho dữ liệu doanh nghiệp chuẩn hóa, tích hợp (truyền thống Inmon) từ đó các kho dữ liệu con được tạo ra, hay xây dựng trực tiếp các kho dữ liệu con lược đồ sao chiều (truyền thống Kimball); sự lựa chọn này đánh đổi tính tích hợp và linh hoạt với sự đơn giản và tốc độ truy vấn.

Key figures

  • William H. Inmon
  • Ralph Kimball
  • Shawn N. Murphy
  • Isaac Kohane

Related topics

Seminal works

  • inmon-2005
  • kimball-ross-2013
  • murphy-2010

Frequently asked questions

Tại sao không chỉ chạy phân tích trực tiếp trên cơ sở dữ liệu hồ sơ sức khỏe điện tử?
Các hệ thống giao dịch được điều chỉnh cho nhiều thao tác đọc và ghi nhỏ hỗ trợ chăm sóc trực tiếp, vì vậy các truy vấn phân tích lớn có thể làm chậm chúng và có nguy cơ ảnh hưởng đến hoạt động lâm sàng. Một kho dữ liệu tách biệt phân tích khỏi việc cung cấp dịch vụ chăm sóc và cấu trúc dữ liệu để truy vấn hiệu quả.
Mô hình dữ liệu chung là gì và tại sao nó quan trọng đối với thiết kế kho dữ liệu?
Mô hình dữ liệu chung là một lược đồ và từ vựng được chia sẻ mà nhiều tổ chức áp dụng cho các kho dữ liệu của họ. Việc ánh xạ tới nó cho phép cùng một truy vấn phân tích chạy trên các địa điểm mà không cần viết lại, điều này hỗ trợ nghiên cứu đa tổ chức và khả năng tái tạo.

Methods for this concept

Related concepts