Что означает I-квадрат, равный 75%?

Это указывает на то, что примерно три четверти общей вариации между оценками исследований отражают истинные межисследовательские различия, а не ошибку выборки; но поскольку I-квадрат зависит от точности исследования, его следует интерпретировать вместе с фактическим разбросом эффектов, а не по фиксированной метке.

Является ли высокая гетерогенность причиной не объединять исследования?

Не автоматически. Высокая гетерогенность сигнализирует о том, что исследования различаются, и побуждает к выяснению причин, но решение об объединении, использовании модели со случайными эффектами или воздержании зависит от того, объяснимы ли различия и клинически сопоставимы ли исследования.

Гетерогенность в метаанализе

Гетерогенность в метаанализе — это вариация истинных эффектов между объединенными исследованиями, выходящая за рамки того, что могло бы быть вызвано одной только ошибкой выборки. Измерение и интерпретация гетерогенности позволяет аналитику определить, оценивают ли исследования по существу одно и то же или действительно разные вещи, что влияет как на используемую модель, так и на степень доверия к сводным данным.

Найти тему в PaperMindСкороFind papers & topics

Tools & resources

Скачать слайды

Learn & explore

ВидеоСкоро

Definition

Гетерогенность — это степень, в которой истинные эффекты, оцененные отдельными исследованиями в метаанализе, отличаются друг от друга, количественно выраженная такими статистическими показателями, как Q Кохрана, I-квадрат (доля общей вариации, обусловленная межисследовательскими различиями, а не случайностью) и тау-квадрат (оценочная межисследовательская дисперсия).

Scope

Эта статья охватывает статистическую оценку межисследовательской гетерогенности: критерий Кохрана Q, статистику I-квадрат, межисследовательскую дисперсию тау-квадрат и известные ограничения этих мер. Она рассматривает гетерогенность как методологическую тему в рамках синтеза доказательств и предлагает справочное описание, а не клинические рекомендации.

Core questions

Оценивают ли включенные исследования один общий эффект или ряд различных эффектов?
Какая часть наблюдаемой вариации является реальным межисследовательским различием по сравнению с шумом выборки?
Как следует интерпретировать I-квадрат и тау-квадрат, и в каких случаях они вводят в заблуждение?
Когда гетерогенность делает единую объединенную оценку неприемлемой?

Key concepts

Критерий Q Кохрана
Статистика I-квадрат
Тау-квадрат (межисследовательская дисперсия)
Клиническая и статистическая гетерогенность
Прогностический интервал
Анализ подгрупп как ответ на гетерогенность

Mechanisms

Общая вариация между оценками исследований разделяется на ошибку выборки внутри исследования и истинную вариацию между исследованиями. Q Кохрана сравнивает наблюдаемое рассеяние с тем, что предсказывает только ошибка выборки; поскольку Q имеет низкую мощность при малом количестве исследований, Хиггинс и Томпсон предложили I-квадрат — процент общей вариации, обусловленной межисследовательской гетерогенностью, а не случайностью, который не зависит от количества исследований. Тау-квадрат оценивает дисперсию распределения основного эффекта и напрямую используется при взвешивании в моделях со случайными эффектами и при построении прогностических интервалов. Важные предостережения: Рюкер и коллеги показывают, что I-квадрат зависит от точности включенных исследований, поэтому он может быть большим просто потому, что исследования точны, а фон Хиппель показывает, что он нестабилен и может быть смещен в небольших метаанализах, поэтому эти статистические данные должны рассматриваться вместе с абсолютным разбросом эффектов, а не по фиксированным пороговым значениям.

Clinical relevance

То, как и в какой степени совокупность исследований суммируется, сильно зависит от ее гетерогенности, поэтому оценка статистических данных о гетерогенности является частью определения того, насколько объединенный результат заслуживает доверия в рекомендациях и оценке медицинских технологий. Эта статья описывает, как измеряется гетерогенность, и не является основой для индивидуальных клинических решений.

Evidence & guidelines

Руководство Кокрана описывает ожидаемую практику оценки и отчетности о гетерогенности, включая использование I-квадрат с осторожной интерпретацией и роль прогностических интервалов, что соответствует обобщенной здесь методологической литературе.

History

Критерий Q Кохрана для объединения экспериментов датируется серединой XX века, но он оказался недостаточно мощным для небольшого числа исследований, характерных для клинического метаанализа. Статья Хиггинса и Томпсона 2002 года, за которой последовало широко цитируемое изложение в BMJ 2003 года, представила I-квадрат как интерпретируемую, независимую от размера выборки меру, после чего корректирующая литература (Rücker et al., 2008; von Hippel, 2015) уточнила ее зависимость от точности исследования и ее нестабильность в небольших синтезах.

Debates

Насколько следует полагаться на I-квадрат при оценке гетерогенности?: I-квадрат зависит от точности включенных исследований и может быть нестабильным при объединении небольшого числа исследований, поэтому комментаторы предостерегают от фиксированных пороговых значений и рекомендуют рассматривать его вместе с тау-квадратом и абсолютным разбросом эффектов.

Key figures

Julian Higgins
Simon Thompson
Gerta Rücker
Paul von Hippel
William Cochran

Seminal works

higgins-thompson-2002
higgins-2003

Frequently asked questions

Что означает I-квадрат, равный 75%?: Это указывает на то, что примерно три четверти общей вариации между оценками исследований отражают истинные межисследовательские различия, а не ошибку выборки; но поскольку I-квадрат зависит от точности исследования, его следует интерпретировать вместе с фактическим разбросом эффектов, а не по фиксированной метке.
Является ли высокая гетерогенность причиной не объединять исследования?: Не автоматически. Высокая гетерогенность сигнализирует о том, что исследования различаются, и побуждает к выяснению причин, но решение об объединении, использовании модели со случайными эффектами или воздержании зависит от того, объяснимы ли различия и клинически сопоставимы ли исследования.