ScholarGate
Ассистент

Проектирование и архитектура хранилищ клинических данных

Хранилище клинических данных — это интегрированное, ориентированное на запросы хранилище, которое объединяет данные из транзакционных источников системы здравоохранения, чтобы их можно было анализировать, не нарушая работу операционных систем оказания медицинской помощи. Его проектирование и архитектура определяют, как исходные данные извлекаются, моделируются и предоставляются для исследований, оценки качества и оперативной отчетности.

Найти тему в PaperMindСкороFind papers & topics
Tools & resources
Скачать слайды
Learn & explore
ВидеоСкоро

Definition

Проектирование хранилища клинических данных — это архитектура и инженерия интегрированных репозиториев, которые консолидируют медицинские данные из множества операционных источников в структуру, оптимизированную для запросов, анализа и повторного использования, а не для транзакционного обслуживания.

Scope

Эта тема охватывает архитектурные паттерны, лежащие в основе хранилищ клинических данных: разделение аналитических и транзакционных систем, конвейеры извлечения, преобразования и загрузки (ETL), размерное (dimensional) и нормализованное моделирование, а также использование общих моделей данных для обеспечения переносимости запросов. Она рассматривает проектирование хранилища как тему информатики и инженерии данных, а не как операционные инструкции для какой-либо конкретной платформы.

Key concepts

  • Разделение аналитических и транзакционных рабочих нагрузок (OLAP против OLTP)
  • Конвейеры извлечения, преобразования и загрузки (ETL)
  • Размерное моделирование (схемы «звезда» и «снежинка»)
  • Нормализованное (третья нормальная форма) проектирование корпоративного хранилища
  • Общие модели данных
  • Витрины данных
  • Метаданные и происхождение данных
  • Медленно меняющиеся измерения

Mechanisms

Операционные системы, такие как электронные медицинские карты, оптимизированы для быстрых индивидуальных транзакций, что делает их плохо приспособленными для больших аналитических запросов. Хранилище клинических данных решает эту проблему путем периодического извлечения данных из этих источников, их преобразования и очистки, а также загрузки в отдельный репозиторий, структурированный для анализа. Два влиятельных подхода к проектированию определяют уровень моделирования: нормализованный подход к корпоративному хранилищу, связанный с Инмоном, и подход к размерной схеме «звезда», связанный с Кимбаллом, который организует данные в таблицы фактов и измерений для эффективной агрегации. В исследовательских условиях платформы, такие как i2b2, организуют данные пациентов вокруг схемы «звезда» и контролируемой онтологии, чтобы исследователи могли запрашивать когорты. Сопоставление хранилища с общей моделью данных позволяет выполнять один и тот же запрос в разных учреждениях.

Clinical relevance

Архитектура хранилища клинических данных определяет, какие анализы возможны и насколько надежно могут быть идентифицированы когорты, что, в свою очередь, влияет на оценку качества и исследования, которые информируют об оказании медицинской помощи. Понимание проектирования хранилища помогает пользователям интерпретировать, откуда поступают аналитические данные и какие преобразования они претерпели. Это справочное описание инфраструктуры и не содержит индивидуальных клинических рекомендаций.

History

Хранение данных появилось в общих информационных системах в конце двадцатого века, при этом нормализованная корпоративная модель Инмона и размерная модель Кимбалла сформировали основную дискуссию о проектировании. Здравоохранение переняло эти паттерны по мере накопления многократно используемых данных в электронных записях; ориентированные на исследования платформы, такие как i2b2 в 2010 году, продемонстрировали архитектуры хранилищ, адаптированные для обнаружения клинических когорт, а общие модели данных позднее стандартизировали межведомственные запросы.

Debates

Нормализованное корпоративное хранилище против размерного моделирования
Разработчики расходятся во мнениях относительно того, следует ли строить нормализованное, интегрированное корпоративное хранилище (традиция Инмона), из которого затем создаются витрины данных, или напрямую строить размерные витрины со схемой «звезда» (традиция Кимбалла); выбор представляет собой компромисс между интеграцией и гибкостью, с одной стороны, и простотой и скоростью запросов, с другой.

Key figures

  • William H. Inmon
  • Ralph Kimball
  • Shawn N. Murphy
  • Isaac Kohane

Related topics

Seminal works

  • inmon-2005
  • kimball-ross-2013
  • murphy-2010

Frequently asked questions

Почему бы просто не запускать аналитику непосредственно на базе данных электронных медицинских карт?
Транзакционные системы настроены на множество небольших операций чтения и записи, которые поддерживают текущее оказание медицинской помощи, поэтому большие аналитические запросы могут замедлять их работу и создавать риск влияния на клинические операции. Хранилище данных отделяет анализ от оказания медицинской помощи и структурирует данные для эффективного запроса.
Что такое общая модель данных и почему она важна для проектирования хранилища?
Общая модель данных — это общая схема и словарь, которые несколько учреждений принимают для своих хранилищ. Сопоставление с ней позволяет выполнять один и тот же аналитический запрос на разных площадках без переписывания, что поддерживает многоинституциональные исследования и воспроизводимость.

Methods for this concept

Related concepts