Внутренняя валидность
Внутренняя валидность — это степень, в которой оценка связи между воздействием и исходом в исследовании является корректной для фактически изученных людей, то есть свободной от систематической ошибки. Исследование обладает внутренней валидностью в той мере, в какой адекватно контролируются смешивающие факторы (confounding), систематическая ошибка отбора (selection bias) и информационная систематическая ошибка (information bias). Это является предпосылкой для постановки отдельного вопроса о внешней валидности: распространяется ли полученный результат за пределы исследуемой популяции.
Definition
Внутренняя валидность — это степень, в которой измеренная связь между воздействием и исходом в исследовании отражает истинную связь в исследуемой популяции, не искаженную смешивающими факторами, систематической ошибкой отбора или информационной систематической ошибкой.
Scope
Статья охватывает значение внутренней валидности, три систематические угрозы, которые она суммирует, ее связь со случайной ошибкой и внешней валидностью, а также то, как стандарты отчетности требуют от исследований учитывать ее. Это методологический справочник, не содержащий клинических рекомендаций.
Core questions
- Были ли смешивающие факторы адекватно контролированы на этапе планирования или анализа?
- Мог ли отбор или выбывание из выборки исследования исказить оценку?
- Были ли воздействие и исход измерены достаточно точно, чтобы избежать существенной ошибочной классификации?
- Сообщается ли неопределенность оценки (случайная ошибка) наряду с этими систематическими проблемами?
Key concepts
- Систематическая ошибка (bias)
- Смешивающий фактор (confounding)
- Систематическая ошибка отбора (selection bias)
- Информационная систематическая ошибка (information bias)
- Случайная ошибка и точность
- Внешняя валидность (обобщаемость)
- Стандарты отчетности (STROBE)
Mechanisms
Внутренняя валидность лучше всего понимается как отсутствие трех систематических ошибок. Смешивающие факторы (confounding) смешивают эффект воздействия с эффектом общей причины; систематическая ошибка отбора (selection bias) искажает связь через то, как субъекты включаются в анализ или остаются в нем; а информационная систематическая ошибка (information bias) искажает ее через ошибочные измерения. Исследование с высокой внутренней валидностью устранило все три типа ошибок, так что оставшееся отклонение от истины представляет собой главным образом случайную ошибку, которая количественно оценивается доверительными интервалами и уменьшается с увеличением размера выборки. Внутренняя валидность логически предшествует внешней валидности (обобщаемости): оценка, которая является смещенной для исследуемой популяции, не может быть надежно экстраполирована на другие. Инструменты, повышающие внутреннюю валидность, включают рандомизацию, ограничение и сопоставление (matching), соответствующую корректировку, основанную на причинно-следственных рассуждениях, слепые и стандартизированные измерения, а также минимизацию потерь при последующем наблюдении.
Clinical relevance
Внутренняя валидность является первым, что оценивается при суждении о том, следует ли доверять результатам исследования, поскольку вывод, смещенный для его собственных участников, предоставляет мало надежных доказательств. Концепция описывает, как оценивается достоверность доказательств; она не направляет диагностику или лечение какого-либо конкретного человека.
Epidemiology
Оценка внутренней валидности является частью каждой критической оценки наблюдательных и экспериментальных исследований, а руководства по отчетности, такие как STROBE, требуют от авторов описывать потенциальные источники систематических ошибок и ограничения, влияющие на валидность. Систематическое разделение внутренней и внешней валидности является стандартным организующим принципом в эпидемиологических методах.
Evidence & guidelines
Заявление STROBE (von Elm et al., 2007) требует от наблюдательных исследований сообщать об усилиях по устранению систематических ошибок и смешивающих факторов, а также обсуждать ограничения, влияющие на внутреннюю и внешнюю валидность, что делает эту концепцию операциональной в отчетности исследований.
History
Различие между внутренней и внешней валидностью было сформулировано в работах по методам исследования середины XX века и было принято в эпидемиологии по мере того, как эта область формализовала свой подход к систематическим ошибкам и смешивающим факторам. Работы по причинно-следственным выводам конца XX века и, позднее, руководства по отчетности, такие как STROBE, придали концепции внутренней валидности точное содержание и место в рутинной оценке и отчетности исследований.
Debates
- Как следует соотносить внутреннюю и внешнюю валидность?
- Усиление внутренней валидности (например, посредством ограничения или строго контролируемых дизайнов) может сузить исследуемую популяцию и, таким образом, ограничить обобщаемость; комментаторы расходятся во мнениях относительно того, какой приоритет следует отдавать каждой из них, хотя внутренняя валидность обычно рассматривается как предпосылка для любого полезного внешнего вывода.
Key figures
- Kenneth Rothman
- Sander Greenland
- David Grimes
- Kenneth Schulz
Related topics
Seminal works
- grimes-schulz-2002-bias
- vonelm-2007
Frequently asked questions
- В чем разница между внутренней и внешней валидностью?
- Внутренняя валидность — это вопрос о том, является ли оценка корректной для фактически изученных людей (свободной от систематической ошибки); внешняя валидность — это вопрос о том, распространяется ли эта оценка на другие популяции или условия.
- Гарантирует ли большой размер выборки внутреннюю валидность?
- Нет. Большая выборка уменьшает случайную ошибку и сужает доверительные интервалы, но она никак не устраняет систематические ошибки, такие как смешивающие факторы, систематическая ошибка отбора или информационная систематическая ошибка, которые определяют внутреннюю валидность.
- Какие угрозы суммирует внутренняя валидность?
- Она суммирует свободу от трех основных систематических ошибок — смешивающих факторов, систематической ошибки отбора и информационной систематической ошибки — в отличие от случайной (выборочной) ошибки.