ScholarGate
Asistente

Control de Calidad y Corrección de Errores en la Secuenciación

Cada ejecución de secuenciación produce llamadas de base de fiabilidad variable, por lo que el control de calidad y la corrección de errores son los pasos que cuantifican la precisión por base, filtran o recortan los datos de baja calidad y corrigen los artefactos sistemáticos antes de que las lecturas se ensamblen o se utilicen para la llamada de variantes. Sin ellos, las conclusiones genómicas posteriores pueden verse distorsionadas por el ruido técnico en lugar de por la biología.

Encontrar tema con PaperMindPróximamenteFind papers & topics
Tools & resources
Descargar diapositivas
Learn & explore
VídeoPróximamente

Definition

El control de calidad en la secuenciación es la evaluación y mejora de la fiabilidad de las lecturas, utilizando puntuaciones de calidad por base, recorte y filtrado, y métodos de corrección de errores para eliminar o corregir artefactos técnicos, de modo que el ensamblaje y la llamada de variantes reflejen la secuencia subyacente en lugar del error de medición.

Scope

La entrada cubre la puntuación de calidad por base (Phred), los tipos de errores y sesgos que afectan a las lecturas de secuenciación, el recorte y filtrado de lecturas, y el papel de la cobertura redundante en la distinción entre la señal verdadera y el error. Es un tema metodológico sobre la fiabilidad de los datos y no proporciona protocolos clínicos o de laboratorio.

Core questions

  • ¿Cómo se cuantifica la fiabilidad de una llamada de base individual?
  • ¿Qué tipos de errores y sesgos afectan a las lecturas de secuenciación?
  • ¿Cómo reducen el impacto de los errores el recorte, el filtrado y la cobertura redundante?

Key concepts

  • Puntuación de calidad Phred
  • Precisión de la llamada de base
  • Recorte y filtrado de lecturas
  • Perfiles de error de secuenciación
  • Reducción de errores por cobertura y consenso
  • Recorte de adaptadores y de calidad
  • Control de variantes falsas positivas

Mechanisms

Las plataformas de secuenciación asignan a cada llamada de base una puntuación de calidad Phred, una estimación logarítmica de la probabilidad de que la llamada sea incorrecta, lo que permite marcar las bases de baja confianza. Las herramientas de control de calidad recortan los adaptadores y los extremos de baja calidad y filtran las lecturas poco fiables antes del análisis. Dado que los errores son en parte aleatorios y en parte sistemáticos, secuenciar cada posición muchas veces permite establecer un consenso para que los errores aislados sean superados por la mayoría, mientras que la caracterización de los perfiles de error ayuda a distinguir los artefactos recurrentes de las variantes genuinas de baja frecuencia. Estos pasos reducen los falsos positivos en la llamada de variantes posterior y mejoran la precisión del ensamblaje.

Clinical relevance

El control de calidad y la corrección de errores determinan si los hallazgos genómicos reflejan la secuencia verdadera o el ruido técnico, lo cual es crítico dondequiera que la secuenciación informe la investigación o la interpretación clínica. Esta entrada es material de referencia educativa sobre la fiabilidad de los datos y no constituye una guía para ninguna prueba o decisión clínica específica.

Evidence & guidelines

Los métodos se documentan a través de artículos de herramientas y análisis primarios en lugar de guías clínicas: Ewing et al. (1998) establecieron la puntuación de calidad por base Phred, Bolger et al. (2014) es una herramienta de recorte de lecturas ampliamente utilizada, y Ma et al. (2019) caracteriza los perfiles de error en datos de secuenciación profunda; revisiones como Sims et al. (2014) conectan la cobertura con el control de errores.

History

La puntuación de calidad por base se formalizó con el programa Phred en 1998, proporcionando a los datos de secuenciación una medida estandarizada e interpretable de la confianza en la llamada de base que se volvió universal. A medida que las plataformas de alto rendimiento producían vastos volúmenes de lecturas, surgieron herramientas dedicadas de recorte y filtrado en la década de 2010, y los análisis detallados de los perfiles de error refinaron cómo se separan las variantes genuinas de baja frecuencia de los artefactos de secuenciación sistemáticos.

Key figures

  • Phil Green
  • Brent Ewing
  • Björn Usadel

Related topics

Seminal works

  • ewing-1998
  • bolger-2014
  • ma-2019

Frequently asked questions

¿Qué es una puntuación de calidad Phred?
Es una medida logarítmica de la probabilidad estimada de que una llamada de base sea incorrecta; por ejemplo, una puntuación Phred de 30 corresponde a aproximadamente una probabilidad de error de 1 entre 1000, por lo que las puntuaciones más altas indican llamadas de base más fiables.
¿Cómo reduce los errores la secuenciación de la misma posición muchas veces?
Cuando una posición está cubierta por muchas lecturas independientes, los errores aleatorios en lecturas individuales pueden ser superados por la mayoría, por lo que tomar un consenso entre las lecturas produce una llamada de base más precisa que cualquier lectura individual.

Methods for this concept

Related concepts