ScholarGate
Assistent

Qualitätskontrolle und Fehlerkorrektur in der Sequenzierung

Jeder Sequenzierungslauf erzeugt Basenaufrufe unterschiedlicher Zuverlässigkeit. Daher sind Qualitätskontrolle und Fehlerkorrektur die Schritte, die die Genauigkeit pro Base quantifizieren, minderwertige Daten filtern oder trimmen und systematische Artefakte korrigieren, bevor Reads assembliert oder für die Variantenidentifizierung verwendet werden. Ohne diese Schritte können nachgeschaltete genomische Schlussfolgerungen durch technisches Rauschen und nicht durch Biologie verzerrt werden.

Thema finden mit PaperMindDemnächstFind papers & topics
Tools & resources
Folien herunterladen
Learn & explore
VideoDemnächst

Definition

Qualitätskontrolle in der Sequenzierung ist die Bewertung und Verbesserung der Read-Zuverlässigkeit unter Verwendung von Qualitätsbewertungen pro Base, Trimmen und Filtern sowie Fehlerkorrekturmethoden, um technische Artefakte zu entfernen oder zu korrigieren, damit Assemblierung und Variantenidentifizierung die zugrunde liegende Sequenz und nicht Messfehler widerspiegeln.

Scope

Der Eintrag behandelt die Qualitätsbewertung pro Base (Phred), die Arten von Fehlern und Verzerrungen, die Sequenzierungs-Reads beeinflussen, das Trimmen und Filtern von Reads sowie die Rolle redundanter Abdeckung bei der Unterscheidung von echtem Signal und Fehler. Es handelt sich um ein methodisches Thema zur Datenzuverlässigkeit und enthält keine klinischen oder Laborprotokolle.

Core questions

  • Wie wird die Zuverlässigkeit eines einzelnen Basenaufrufs quantifiziert?
  • Welche Arten von Fehlern und Verzerrungen beeinflussen Sequenzierungs-Reads?
  • Wie reduzieren Trimmen, Filtern und redundante Abdeckung die Auswirkungen von Fehlern?

Key concepts

  • Phred-Qualitätswert
  • Basenaufruf-Genauigkeit
  • Read-Trimmen und -Filtern
  • Sequenzierungs-Fehlerprofile
  • Abdeckung und Konsens-Fehlerreduktion
  • Adapter- und Qualitäts-Trimmen
  • Kontrolle falsch-positiver Varianten

Mechanisms

Sequenzierungsplattformen weisen jedem Basenaufruf einen Phred-Qualitätswert zu, eine logarithmische Schätzung der Wahrscheinlichkeit, dass der Aufruf falsch ist, wodurch Basen mit geringer Konfidenz markiert werden können. Qualitätskontrollwerkzeuge trimmen dann Adapter und Enden geringer Qualität und filtern unzuverlässige Reads vor der Analyse. Da Fehler teilweise zufällig und teilweise systematisch sind, ermöglicht die mehrfache Sequenzierung jeder Position die Bildung eines Konsenses, sodass isolierte Fehler überstimmt werden, während die Charakterisierung von Fehlerprofilen hilft, wiederkehrende Artefakte von echten seltenen Varianten zu unterscheiden. Diese Schritte reduzieren falsch-positive Ergebnisse bei der nachgeschalteten Variantenidentifizierung und verbessern die Genauigkeit der Assemblierung.

Clinical relevance

Qualitätskontrolle und Fehlerkorrektur bestimmen, ob genomische Befunde die wahre Sequenz oder technisches Rauschen widerspiegeln, was überall dort entscheidend ist, wo Sequenzierung Forschung oder klinische Interpretation beeinflusst. Dieser Eintrag ist ein pädagogisches Referenzmaterial zur Datenzuverlässigkeit und stellt keine Anleitung für einen spezifischen Test oder eine klinische Entscheidung dar.

Evidence & guidelines

Die Methoden sind eher durch primäre Tool- und Analysepublikationen als durch klinische Leitlinien dokumentiert: Ewing et al. (1998) etablierten den Phred-Qualitätswert pro Base, Bolger et al. (2014) ist ein weit verbreitetes Read-Trimming-Tool, und Ma et al. (2019) charakterisiert Fehlerprofile in tiefen Sequenzierungsdaten; Übersichtsartikel wie Sims et al. (2014) verbinden Abdeckung mit Fehlerkontrolle.

History

Die Qualitätsbewertung pro Base wurde 1998 mit dem Phred-Programm formalisiert und lieferte Sequenzierungsdaten ein standardisiertes, interpretierbares Maß für die Basenaufruf-Konfidenz, das universell wurde. Als Hochdurchsatzplattformen riesige Read-Mengen produzierten, entstanden in den 2010er Jahren spezielle Trimming- und Filterwerkzeuge, und detaillierte Analysen von Fehlerprofilen verfeinerten, wie echte seltene Varianten von systematischen Sequenzierungsartefakten getrennt werden.

Key figures

  • Phil Green
  • Brent Ewing
  • Björn Usadel

Related topics

Seminal works

  • ewing-1998
  • bolger-2014
  • ma-2019

Frequently asked questions

Was ist ein Phred-Qualitätswert?
Es ist ein logarithmisches Maß für die geschätzte Wahrscheinlichkeit, dass ein Basenaufruf falsch ist; zum Beispiel entspricht ein Phred-Wert von 30 etwa einer Fehlerwahrscheinlichkeit von 1 zu 1000, sodass höhere Werte zuverlässigere Basenaufrufe anzeigen.
Wie reduziert die mehrfache Sequenzierung derselben Position Fehler?
Wenn eine Position von vielen unabhängigen Reads abgedeckt wird, können zufällige Fehler in einzelnen Reads von der Mehrheit überstimmt werden, sodass die Bildung eines Konsenses über die Reads einen genaueren Basenaufruf ergibt als jeder einzelne Read.

Methods for this concept

Related concepts