ScholarGate
Assistente

Controle de Qualidade e Correção de Erros no Sequenciamento

Cada corrida de sequenciamento produz chamadas de base de confiabilidade variável, portanto, o controle de qualidade e a correção de erros são as etapas que quantificam a precisão por base, filtram ou aparam dados de baixa qualidade e corrigem artefatos sistemáticos antes que as leituras sejam montadas ou usadas para a chamada de variantes. Sem eles, as conclusões genômicas a jusante podem ser distorcidas por ruído técnico em vez de biologia.

Encontrar tema com PaperMindEm breveFind papers & topics
Tools & resources
Baixar slides
Learn & explore
VídeoEm breve

Definition

O controle de qualidade no sequenciamento é a avaliação e melhoria da confiabilidade das leituras, utilizando pontuações de qualidade por base, corte e filtragem, e métodos de correção de erros para remover ou corrigir artefatos técnicos, de modo que a montagem e a chamada de variantes reflitam a sequência subjacente em vez de erros de medição.

Scope

A entrada abrange a pontuação de qualidade por base (Phred), os tipos de erros e vieses que afetam as leituras de sequenciamento, o corte e filtragem de leituras, e o papel da cobertura redundante na distinção entre sinal verdadeiro e erro. É um tópico metodológico sobre a confiabilidade dos dados e não fornece protocolos clínicos ou laboratoriais.

Core questions

  • Como a confiabilidade de uma chamada de base individual é quantificada?
  • Que tipos de erros e vieses afetam as leituras de sequenciamento?
  • Como o corte, a filtragem e a cobertura redundante reduzem o impacto dos erros?

Key concepts

  • Pontuação de qualidade Phred
  • Precisão da chamada de base
  • Corte e filtragem de leituras
  • Perfis de erro de sequenciamento
  • Cobertura e redução de erros por consenso
  • Corte de adaptadores e de qualidade
  • Controle de variantes falso-positivas

Mechanisms

As plataformas de sequenciamento atribuem a cada chamada de base uma pontuação de qualidade Phred, uma estimativa logarítmica da probabilidade de que a chamada esteja errada, o que permite sinalizar bases de baixa confiança. Ferramentas de controle de qualidade então aparam adaptadores e extremidades de baixa qualidade e filtram leituras não confiáveis antes da análise. Como os erros são parcialmente aleatórios e parcialmente sistemáticos, sequenciar cada posição muitas vezes permite que um consenso seja estabelecido para que erros isolados sejam superados pela maioria, enquanto a caracterização de perfis de erro ajuda a distinguir artefatos recorrentes de variantes genuínas de baixa frequência. Essas etapas reduzem falsos positivos na chamada de variantes a jusante e melhoram a precisão da montagem.

Clinical relevance

O controle de qualidade e a correção de erros determinam se os achados genômicos refletem a sequência verdadeira ou o ruído técnico, o que é crítico onde quer que o sequenciamento informe a pesquisa ou a interpretação clínica. Esta entrada é material de referência educacional sobre confiabilidade de dados e não constitui orientação para qualquer teste específico ou decisão clínica.

Evidence & guidelines

Os métodos são documentados através de artigos primários de ferramentas e análises, em vez de diretrizes clínicas: Ewing et al. (1998) estabeleceram a pontuação de qualidade por base Phred, Bolger et al. (2014) é uma ferramenta amplamente utilizada para corte de leituras, e Ma et al. (2019) caracteriza perfis de erro em dados de sequenciamento profundo; revisões como Sims et al. (2014) conectam a cobertura ao controle de erros.

History

A pontuação de qualidade por base foi formalizada com o programa Phred em 1998, fornecendo aos dados de sequenciamento uma medida padronizada e interpretável de confiança da chamada de base que se tornou universal. À medida que as plataformas de alto rendimento produziam vastos volumes de leituras, ferramentas dedicadas de corte e filtragem surgiram nos anos 2010, e análises detalhadas de perfis de erro refinaram como as variantes genuínas de baixa frequência são separadas de artefatos sistemáticos de sequenciamento.

Key figures

  • Phil Green
  • Brent Ewing
  • Björn Usadel

Related topics

Seminal works

  • ewing-1998
  • bolger-2014
  • ma-2019

Frequently asked questions

O que é uma pontuação de qualidade Phred?
É uma medida logarítmica da probabilidade estimada de que uma chamada de base esteja incorreta; por exemplo, uma pontuação Phred de 30 corresponde a cerca de 1 chance em 1000 de erro, portanto, pontuações mais altas indicam chamadas de base mais confiáveis.
Como o sequenciamento da mesma posição muitas vezes reduz erros?
Quando uma posição é coberta por muitas leituras independentes, erros aleatórios em leituras individuais podem ser superados pela maioria, de modo que a obtenção de um consenso entre as leituras produz uma chamada de base mais precisa do que qualquer leitura única.

Methods for this concept

Related concepts