Evaluación Crítica y Valoración de la Evidencia Individual
La evaluación crítica es el proceso estructurado de examinar sistemáticamente una pieza de investigación individual para juzgar su validez, la magnitud y precisión de sus resultados, y su relevancia para una pregunta dada. Es la habilidad práctica que convierte la lectura de un estudio en su evaluación, y se sitúa en el centro de la práctica basada en la evidencia: antes de que la evidencia pueda ser aplicada o sintetizada, cada estudio debe ser evaluado primero en sus propios términos.
Definition
La evaluación crítica es la valoración explícita, basada en criterios, de un estudio de investigación individual para determinar la fiabilidad de sus métodos (validez interna), el significado y la precisión de sus hallazgos, y la medida en que esos hallazgos pueden aplicarse a otros entornos o poblaciones (validez externa).
Scope
Esta área orienta al lector sobre cómo se evalúan los estudios individuales en lugar de cómo se agrupan los cuerpos de evidencia. Cubre las preguntas genéricas de evaluación (¿es válido? ¿cuáles son los resultados? ¿son aplicables?), las herramientas estructuradas y listas de verificación utilizadas para aplicar esas preguntas, y los estándares de reporte (como CONSORT y STROBE) que hacen que un estudio sea lo suficientemente transparente como para ser evaluado en primer lugar. Es de carácter educativo-referencial y no proporciona recomendaciones clínicas.
Sub-topics
Core questions
- ¿Son válidos los resultados de este estudio individual, considerando cómo fue diseñado y realizado?
- ¿Cuáles son los resultados, y cuán precisos e importantes son clínica o prácticamente?
- ¿Pueden aplicarse los resultados a la población, el entorno o la pregunta en cuestión?
- ¿Cómo las herramientas estructuradas y los estándares de reporte hacen que un estudio sea evaluable y reducen el juicio subjetivo?
Key concepts
- Validez interna
- Validez externa (generalizabilidad)
- Riesgo de sesgo
- Marco de evaluación de validez-resultados-aplicabilidad
- Estándares de reporte versus calidad metodológica
- Herramientas y listas de verificación de evaluación crítica
- Reproducibilidad y transparencia del reporte
Mechanisms
La evaluación procede mapeando el diseño de un estudio con los sesgos a los que ese diseño es propenso, y luego preguntando si los autores tomaron las medidas adecuadas contra ellos. El marco de las Guías para Usuarios (Users' Guides), ampliamente enseñado, organiza esto en tres preguntas secuenciales — ¿son válidos los resultados, cuáles son los resultados y serán útiles a nivel local? — de modo que el juicio de validez precede a la interpretación del tamaño del efecto, lo que a su vez precede a cualquier juicio sobre la aplicabilidad (Guyatt 1993; Greenhalgh 1997). A diferencia de la evaluación de métodos, los estándares de reporte especifican lo que un artículo debe divulgar para que un lector tenga la información necesaria para evaluarlo en absoluto; los dos son complementarios, porque un estudio bien realizado que está mal reportado no puede ser evaluado, y un estudio reportado de forma transparente aún puede ser juzgado con alto riesgo de sesgo.
Clinical relevance
La evaluación crítica es una competencia central de la práctica basada en la evidencia en todas las profesiones de la salud, porque aplicar la investigación de manera responsable requiere primero juzgar si un estudio es fiable y relevante. Esta área describe cómo se evalúan y reportan los estudios individuales; caracteriza la evidencia en lugar de prescribir decisiones diagnósticas o de tratamiento, y no es un sustituto de las guías clínicas.
Evidence & guidelines
La evaluación se apoya en instrumentos validados y específicos para cada diseño, en lugar de una única lista de verificación universal; una revisión sistemática encontró una amplia variabilidad entre más de cien herramientas publicadas, sin un estándar de oro acordado para ningún diseño (Katrak 2004). Los estándares de reporte respaldados por revistas y la Red EQUATOR — CONSORT para ensayos aleatorizados y STROBE para estudios observacionales — complementan la evaluación al estandarizar la divulgación, mientras que marcos como GRADE extienden la evaluación desde el estudio individual hasta la certeza de un cuerpo de evidencia (Guyatt 2008).
History
La evaluación crítica estructurada surgió de la epidemiología clínica desarrollada en la Universidad McMaster y el movimiento de la medicina basada en la evidencia de la década de 1990. La definición de medicina basada en la evidencia de Sackett y sus colegas enmarcó la evaluación de estudios individuales como una habilidad clínica rutinaria (Sackett 1996), y la serie JAMA Users' Guides codificó preguntas de evaluación explícitas y secuenciales para cada tipo de estudio (Guyatt 1993). Los manuales de Greenhalgh, ampliamente leídos, llevaron el mismo enfoque a una amplia audiencia clínica (Greenhalgh 1997). Paralelamente, los estándares de reporte y las herramientas de evaluación dedicadas proliferaron desde finales de la década de 1990 en adelante, eventualmente coordinados a través de la Red EQUATOR.
Debates
- ¿La calidad del reporte mide la calidad del estudio?
- Los estándares de reporte documentan lo que se divulgó, no si el estudio fue bien realizado; tratar la adhesión a una lista de verificación de reporte como una medida de calidad metodológica confunde la transparencia con la validez, y la mayoría de los autores de estándares advierten contra su uso como puntuaciones de calidad.
- ¿Existe una herramienta de evaluación estándar de oro?
- El gran número de listas de verificación competidoras, con poca superposición en el contenido y sin un instrumento de referencia acordado para ningún diseño, hace que la evaluación dependa en parte de la herramienta elegida y del juicio del revisor.
Key figures
- David Sackett
- Gordon Guyatt
- Trisha Greenhalgh
- Andrew Oxman
Related topics
Seminal works
- sackett-1996
- guyatt-1993
- greenhalgh-1997
Frequently asked questions
- ¿En qué se diferencia la evaluación crítica de la síntesis de evidencia?
- La evaluación crítica valora un estudio a la vez, juzgando su validez y relevancia. La síntesis de evidencia combina los hallazgos de muchos estudios evaluados; la evaluación de cada estudio individual es un paso prerrequisito dentro de la síntesis.
- ¿Es lo mismo seguir una lista de verificación de reporte que evaluar un estudio?
- No. Los estándares de reporte indican si un estudio divulgó suficiente información; la evaluación utiliza esa información para juzgar si los métodos y resultados del estudio pueden ser fiables y aplicados. Un estudio completamente reportado aún puede tener un alto riesgo de sesgo.