Evaluación de pruebas de cribado y diagnóstico
La evaluación de pruebas de cribado y diagnóstico es la rama de la epidemiología que cuantifica la capacidad de una prueba para distinguir a las personas que tienen una condición objetivo de aquellas que no la tienen. Suministra las medidas —sensibilidad, especificidad, valores predictivos, razones de verosimilitud y la curva de características operativas del receptor— utilizadas para juzgar una prueba frente a un estándar de referencia y para anticipar cómo se comportará cuando se aplique a una población.
Definition
La evaluación de pruebas de cribado y diagnóstico es la medición sistemática de la capacidad de una prueba para clasificar a los sujetos según el verdadero estado de la enfermedad, expresada a través de índices de precisión calculados a partir de una tabulación cruzada de los resultados de la prueba frente a un estándar de referencia.
Scope
Esta área orienta al lector sobre las métricas centrales de precisión derivadas de la comparación de una prueba con un estándar de referencia ("oro"), la distinción entre las propiedades intrínsecas de la prueba y el rendimiento predictivo dependiente de la población, el papel de la prevalencia de la enfermedad y los estándares de notificación para los estudios de precisión diagnóstica. Es una visión metodológica, no una guía clínica, y no recomienda ninguna prueba o umbral específico para un individuo.
Sub-topics
Core questions
- ¿Con qué frecuencia una prueba identifica correctamente a las personas que tienen la condición y a las personas que no la tienen?
- Dado un resultado positivo o negativo, ¿qué tan probable es que la condición esté realmente presente o ausente?
- ¿Cómo cambia la prevalencia de la condición en una población el valor práctico de una prueba?
- ¿Cómo se debe elegir e informar el equilibrio entre la detección de casos verdaderos y la evitación de falsas alarmas?
Key concepts
- Estándar de referencia (oro)
- Sensibilidad y especificidad
- Valor predictivo positivo y negativo
- Razones de verosimilitud
- Prevalencia de la enfermedad y probabilidad pre-prueba
- Curva de características operativas del receptor (ROC)
- Umbral diagnóstico y punto de corte
- Sesgo de espectro y verificación
Mechanisms
La evaluación de la prueba comienza clasificando de forma cruzada el resultado de la prueba de cada sujeto (positivo o negativo) frente al verdadero estado de la enfermedad establecido por un estándar de referencia, produciendo las cuatro celdas de una tabla 2x2 (verdaderos positivos, falsos positivos, falsos negativos, verdaderos negativos). La sensibilidad y la especificidad se leen en las columnas del estado de la enfermedad conocido y son, en principio, propiedades de la prueba que no dependen de la frecuencia de la condición. Los valores predictivos se leen en las filas del resultado de la prueba y, por lo tanto, dependen de la prevalencia, porque la misma prueba aplicada donde la enfermedad es rara produce más falsos positivos en relación con los verdaderos positivos. Las razones de verosimilitud combinan la sensibilidad y la especificidad en factores que actualizan las probabilidades previas a la prueba a las probabilidades posteriores a la prueba. Cuando una prueba produce una medición continua u ordinal, mover el umbral de decisión intercambia sensibilidad por especificidad; graficar ese intercambio en todos los umbrales produce la curva ROC, cuya área resume la discriminación independientemente de cualquier punto de corte único.
Clinical relevance
Estas medidas son el lenguaje común para evaluar si una prueba de cribado o diagnóstico es adecuada para su propósito y para comparar pruebas competidoras en igualdad de condiciones. Comprenderlas es fundamental para la evaluación crítica de la literatura diagnóstica; el área explica cómo se genera e interpreta la evidencia diagnóstica y no es una base para decisiones diagnósticas o de tratamiento individuales.
Epidemiology
Las métricas de precisión sustentan las decisiones sobre los programas de cribado poblacional, donde las consecuencias de los falsos positivos y falsos negativos a gran escala, junto con la prevalencia de la enfermedad, determinan si el cribado hace más bien que mal. Se desarrollaron estándares de notificación como STARD para mejorar la exhaustividad y la transparencia de los estudios de precisión diagnóstica, y los sesgos de espectro y verificación son amenazas reconocidas para la validez de la precisión informada.
Evidence & guidelines
La declaración STARD proporciona una lista de verificación para la notificación transparente de estudios de precisión diagnóstica y es ampliamente respaldada por las revistas biomédicas.
History
La evaluación formal de las pruebas diagnósticas surgió del trabajo de mediados del siglo XX sobre la detección de señales y la toma de decisiones clínicas y se agudizó con el reconocimiento en la década de 1970 de que un diseño de estudio sesgado podía inflar la precisión aparente. Las medidas de precisión accesibles se popularizaron en la literatura médica a lo largo de la década de 1990, y los estándares de notificación se consolidaron en la declaración STARD en la década de 2000 y se actualizaron en 2015.
Debates
- ¿Por qué una prueba que suena muy precisa aún puede inducir a error en el cribado?
- Debido a que los valores predictivos dependen de la prevalencia, una prueba con alta sensibilidad y especificidad aún puede generar muchos falsos positivos cuando se aplica a una población de cribado de baja prevalencia, una fuente recurrente de mala interpretación.
- ¿Cuánto distorsionan los sesgos del diseño del estudio la precisión informada?
- El sesgo de espectro y el sesgo de verificación pueden inflar sustancialmente la sensibilidad y especificidad medidas, por lo que la precisión informada debe interpretarse a la luz de cómo se seleccionaron los casos y los controles y cómo se aplicó el estándar de referencia.
Key figures
- Douglas Altman
- Jonathan Deeks
- David Grimes
- Kenneth Schulz
- Patrick Bossuyt
Related topics
Seminal works
- ransohoff-feinstein-1978
- altman-bland-1994a
- altman-bland-1994b
- bossuyt-2015
Frequently asked questions
- ¿Cuál es la diferencia entre una prueba de cribado y una prueba diagnóstica?
- Una prueba de cribado se aplica a personas aparentemente sanas para identificar a aquellas con mayor probabilidad de tener una condición, generalmente favoreciendo la sensibilidad, mientras que una prueba diagnóstica se utiliza para confirmar o excluir una enfermedad en personas que ya se sospecha que la tienen; ambas se evalúan con las mismas medidas de precisión frente a un estándar de referencia.
- ¿Por qué la prevalencia es importante para la utilidad de una prueba?
- La sensibilidad y la especificidad describen la prueba en sí, pero la probabilidad de que un resultado positivo sea correcto (valor predictivo positivo) disminuye a medida que la condición se vuelve más rara, por lo que la misma prueba puede ser informativa en una clínica de alta prevalencia y engañosa en un entorno de cribado de baja prevalencia.