Evaluación del riesgo de sesgo
La evaluación del riesgo de sesgo es la valoración estructurada de la probabilidad de que el diseño, la realización y la comunicación de un estudio hayan distorsionado sus resultados, alejándolos de la verdad. A diferencia de una jerarquía de la evidencia, que clasifica los diseños en general, esta evalúa un estudio individual, preguntando si características como la forma en que se asignaron, cegaron, retuvieron y analizaron los participantes podrían haber sesgado el efecto estimado.
Definition
La evaluación del riesgo de sesgo es una evaluación basada en dominios de la validez interna de un estudio individual, juzgando para cada dominio relevante si es probable que las fallas en el diseño, la realización o la comunicación hayan producido un error sistemático en el efecto estimado.
Scope
La entrada cubre el concepto de sesgo como error sistemático, los dominios estándar evaluados en estudios aleatorizados y no aleatorizados, y las principales herramientas Cochrane utilizadas para realizar estos juicios. Es una referencia metodológica sobre la evaluación a nivel de estudio, no una guía clínica.
Key concepts
- Sesgo como error sistemático (no aleatorio)
- Validez interna
- Sesgo de selección / aleatorización y ocultamiento de la asignación
- Sesgo de rendimiento y detección / cegamiento
- Sesgo de desgaste / datos de resultados incompletos
- Sesgo de comunicación / comunicación selectiva de resultados
- Juicio basado en dominios (riesgo bajo / algunas preocupaciones o incierto / alto)
- Confusión en estudios no aleatorizados
Mechanisms
La evaluación procede por dominios, cada uno de los cuales captura una vía por la cual puede introducirse un error sistemático. En los ensayos aleatorizados, estos incluyen el proceso de aleatorización, las desviaciones de las intervenciones previstas, los datos de resultados faltantes, la medición del resultado y la selección del resultado comunicado; para cada uno, un revisor juzga el riesgo como bajo, de alguna preocupación (o incierto) o alto, a menudo guiado por preguntas de señalización, y llega a un juicio general. Los estudios no aleatorizados de intervenciones añaden la confusión y la selección de participantes como dominios centrales, ya que sin aleatorización estas son las amenazas dominantes. El producto es una evaluación transparente y reproducible que contribuye a la síntesis de la evidencia y a la calificación de la certeza, en lugar de una única puntuación resumida.
Clinical relevance
Los juicios sobre el riesgo de sesgo explican por qué dos estudios sobre la misma pregunta pueden ponderarse de manera diferente y por qué un cuerpo de evidencia puede ser degradado por limitaciones del estudio. Ayudan a los lectores a discernir si un resultado probablemente refleja un efecto real o un artefacto de cómo se realizó el estudio; la entrada describe la metodología de evaluación y no es una base para decisiones clínicas individuales.
Evidence & guidelines
La herramienta Cochrane de riesgo de sesgo (Higgins et al., 2011) estandarizó la evaluación basada en dominios de los ensayos aleatorizados y fue reemplazada por RoB 2 (Sterne et al., 2019), que reestructuró los dominios y añadió preguntas de señalización. ROBINS-I (Sterne et al., 2016) extendió el enfoque a los estudios no aleatorizados de intervenciones, enfatizando la confusión y la selección. En GRADE, el riesgo de sesgo a nivel de estudio es el primer factor que puede disminuir la certeza de un cuerpo de evidencia (Guyatt et al., 2008).
History
La puntuación de calidad de los ensayos en las décadas de 1980 y 1990 se basaba en escalas numéricas cuyos componentes y ponderaciones variaban ampliamente. La Colaboración Cochrane cambió la evaluación hacia un juicio explícito basado en dominios con su herramienta de riesgo de sesgo de 2011, priorizando la transparencia sobre las puntuaciones resumidas. RoB 2 (2019) refinó los dominios de los ensayos aleatorizados e introdujo preguntas de señalización, mientras que ROBINS-I (2016) aportó un marco paralelo centrado en la confusión para los estudios no aleatorizados.
Debates
- Juicio basado en dominios versus puntuaciones numéricas de calidad
- Las puntuaciones de calidad compuestas pueden oscurecer qué fallas específicas importan y en qué medida, por lo que las herramientas modernas favorecen los juicios transparentes por dominio; los críticos señalan que los juicios de dominio aún requieren decisiones subjetivas y pueden variar entre evaluadores.
Key figures
- Julian Higgins
- Jonathan Sterne
- Douglas Altman
- Miguel Hernan
Related topics
Seminal works
- higgins-2011-robtool
- sterne-2019-rob2
- sterne-2016-robinsi
Frequently asked questions
- ¿En qué se diferencia el riesgo de sesgo de la jerarquía de la evidencia?
- La jerarquía clasifica los diseños en general por su vulnerabilidad típica al sesgo, mientras que una evaluación del riesgo de sesgo evalúa qué tan bien se realizó realmente un estudio específico, por lo que un diseño de alto rango aún puede conllevar un alto riesgo de sesgo.
- ¿Por qué las puntuaciones numéricas de calidad han caído en desuso?
- Las puntuaciones compuestas combinan características no relacionadas en un solo número y ocultan qué fallas impulsan el resultado; las herramientas basadas en dominios, en cambio, emiten un juicio separado y transparente para cada fuente potencial de sesgo.