Гетерогенность в метаанализе
Гетерогенность в метаанализе — это вариация истинных эффектов между объединенными исследованиями, выходящая за рамки того, что могло бы быть вызвано одной только ошибкой выборки. Измерение и интерпретация гетерогенности позволяет аналитику определить, оценивают ли исследования по существу одно и то же или действительно разные вещи, что влияет как на используемую модель, так и на степень доверия к сводным данным.
Definition
Гетерогенность — это степень, в которой истинные эффекты, оцененные отдельными исследованиями в метаанализе, отличаются друг от друга, количественно выраженная такими статистическими показателями, как Q Кохрана, I-квадрат (доля общей вариации, обусловленная межисследовательскими различиями, а не случайностью) и тау-квадрат (оценочная межисследовательская дисперсия).
Scope
Эта статья охватывает статистическую оценку межисследовательской гетерогенности: критерий Кохрана Q, статистику I-квадрат, межисследовательскую дисперсию тау-квадрат и известные ограничения этих мер. Она рассматривает гетерогенность как методологическую тему в рамках синтеза доказательств и предлагает справочное описание, а не клинические рекомендации.
Core questions
- Оценивают ли включенные исследования один общий эффект или ряд различных эффектов?
- Какая часть наблюдаемой вариации является реальным межисследовательским различием по сравнению с шумом выборки?
- Как следует интерпретировать I-квадрат и тау-квадрат, и в каких случаях они вводят в заблуждение?
- Когда гетерогенность делает единую объединенную оценку неприемлемой?
Key concepts
- Критерий Q Кохрана
- Статистика I-квадрат
- Тау-квадрат (межисследовательская дисперсия)
- Клиническая и статистическая гетерогенность
- Прогностический интервал
- Анализ подгрупп как ответ на гетерогенность
Mechanisms
Общая вариация между оценками исследований разделяется на ошибку выборки внутри исследования и истинную вариацию между исследованиями. Q Кохрана сравнивает наблюдаемое рассеяние с тем, что предсказывает только ошибка выборки; поскольку Q имеет низкую мощность при малом количестве исследований, Хиггинс и Томпсон предложили I-квадрат — процент общей вариации, обусловленной межисследовательской гетерогенностью, а не случайностью, который не зависит от количества исследований. Тау-квадрат оценивает дисперсию распределения основного эффекта и напрямую используется при взвешивании в моделях со случайными эффектами и при построении прогностических интервалов. Важные предостережения: Рюкер и коллеги показывают, что I-квадрат зависит от точности включенных исследований, поэтому он может быть большим просто потому, что исследования точны, а фон Хиппель показывает, что он нестабилен и может быть смещен в небольших метаанализах, поэтому эти статистические данные должны рассматриваться вместе с абсолютным разбросом эффектов, а не по фиксированным пороговым значениям.
Clinical relevance
То, как и в какой степени совокупность исследований суммируется, сильно зависит от ее гетерогенности, поэтому оценка статистических данных о гетерогенности является частью определения того, насколько объединенный результат заслуживает доверия в рекомендациях и оценке медицинских технологий. Эта статья описывает, как измеряется гетерогенность, и не является основой для индивидуальных клинических решений.
Evidence & guidelines
Руководство Кокрана описывает ожидаемую практику оценки и отчетности о гетерогенности, включая использование I-квадрат с осторожной интерпретацией и роль прогностических интервалов, что соответствует обобщенной здесь методологической литературе.
History
Критерий Q Кохрана для объединения экспериментов датируется серединой XX века, но он оказался недостаточно мощным для небольшого числа исследований, характерных для клинического метаанализа. Статья Хиггинса и Томпсона 2002 года, за которой последовало широко цитируемое изложение в BMJ 2003 года, представила I-квадрат как интерпретируемую, независимую от размера выборки меру, после чего корректирующая литература (Rücker et al., 2008; von Hippel, 2015) уточнила ее зависимость от точности исследования и ее нестабильность в небольших синтезах.
Debates
- Насколько следует полагаться на I-квадрат при оценке гетерогенности?
- I-квадрат зависит от точности включенных исследований и может быть нестабильным при объединении небольшого числа исследований, поэтому комментаторы предостерегают от фиксированных пороговых значений и рекомендуют рассматривать его вместе с тау-квадратом и абсолютным разбросом эффектов.
Key figures
- Julian Higgins
- Simon Thompson
- Gerta Rücker
- Paul von Hippel
- William Cochran
Related topics
Seminal works
- higgins-thompson-2002
- higgins-2003
Frequently asked questions
- Что означает I-квадрат, равный 75%?
- Это указывает на то, что примерно три четверти общей вариации между оценками исследований отражают истинные межисследовательские различия, а не ошибку выборки; но поскольку I-квадрат зависит от точности исследования, его следует интерпретировать вместе с фактическим разбросом эффектов, а не по фиксированной метке.
- Является ли высокая гетерогенность причиной не объединять исследования?
- Не автоматически. Высокая гетерогенность сигнализирует о том, что исследования различаются, и побуждает к выяснению причин, но решение об объединении, использовании модели со случайными эффектами или воздержании зависит от того, объяснимы ли различия и клинически сопоставимы ли исследования.