Genomsequenzierung und -assemblierung
Das Lesen eines Genoms bedeutet, die Reihenfolge seiner Milliarden von Basen zu bestimmen, was Sequenzierungsmaschinen nur in kurzen Stücken tun. Die Software muss dann die vollständige Sequenz rekonstruieren, indem sie überlappende Bereiche dieser Stücke findet.
Definition
Genomsequenzierung ist die experimentelle Bestimmung der Nukleotidreihenfolge der DNA eines Organismus, und Assemblierung ist die rechnerische Rekonstruktion der vollständigen Sequenz aus den vielen kurzen Reads, die ein Sequenzer erzeugt.
Scope
Dieses Thema behandelt die Sanger-Didesoxy-Sequenzierung, die Prinzipien der Next-Generation- und Long-Read-Sequenzierung, die Whole-Genome-Shotgun- und Klon-basierten Strategien, die rechnerische Assemblierung von Reads zu Contigs und Scaffolds, Maße der Assemblierungsqualität wie Coverage und Kontinuität sowie die daraus resultierenden Referenzgenome. Es behandelt, wie die Sequenz eines Genoms bestimmt wird; die Interpretation dieser Sequenz wird in den angrenzenden Themen behandelt.
Core questions
- Wie bestimmt die Sanger-Sequenzierung die Reihenfolge der Basen mithilfe von Kettenabbrechern?
- Was macht Next-Generation- und Long-Read-Sequenzierung schneller und kostengünstiger, und welche Kompromisse gehen damit einher?
- Wie werden Millionen überlappender Reads zu Chromosomen assembliert?
- Was sagen uns Coverage- und Kontinuitätsmaße über die Qualität einer Assemblierung aus?
Key concepts
- Sanger-Didesoxy-Sequenzierung
- Next-Generation- und Long-Read-Sequenzierung
- Whole-Genome-Shotgun-Strategie
- Read-Assemblierung: Contigs und Scaffolds
- Coverage, Kontinuität und Referenzgenome
Mechanisms
Die Sanger-Sequenzierung verwendet kettenabbrochende Didesoxynukleotide, um eine Leiter von Fragmenten zu erzeugen, deren Längen die Sequenz offenbaren; massiv parallele Plattformen lesen Millionen von Fragmenten gleichzeitig, und die Assemblierungssoftware erkennt Überlappungen zwischen Reads, um sie zu Contigs zusammenzuführen, diese zu ordnen und in Scaffolds entlang jedes Chromosoms auszurichten.
Clinical relevance
Erschwingliche Sequenzierung hat die Ganzgenom- und Exomsequenzierung zur Routine für die Diagnose seltener Erbkrankheiten, die Profilierung von Tumoren, die Identifizierung von Krankheitserregern und das Screening von Neugeborenen gemacht und die Sequenzbestimmung von einem wegweisenden Projekt zu einem Standardlabortest transformiert.
History
Sanger führte 1977 die Kettenabbruchsequenzierung ein, das Humangenomprojekt wandte Klon-für-Klon- und Shotgun-Strategien an, um 2001 einen Entwurf der menschlichen Sequenz zu erstellen, und die Einführung der Next-Generation-Sequenzierung Mitte der 2000er Jahre, gefolgt von Long-Read-Plattformen, senkte die Kosten eines menschlichen Genoms von Milliarden von Dollar auf wenige Hundert.
Key figures
- Frederick Sanger
- Eric Lander
- Craig Venter
Related topics
Seminal works
- sanger1977
- lander2001
Frequently asked questions
- Warum muss ein Genom assembliert werden, anstatt es einfach direkt durchzulesen?
- Sequenzierinstrumente können jeweils nur kurze DNA-Abschnitte lesen, daher wird ein Genom in unzählige Fragmente zerlegt; die Assemblierungssoftware rekonstruiert dann die ursprüngliche Reihenfolge, indem sie überlappende Bereiche der Fragmente erkennt.
- Was bedeutet Sequenzierungs-Coverage?
- Coverage ist die durchschnittliche Häufigkeit, mit der jede Base im Genom gelesen wird; eine höhere Coverage erhöht die Zuverlässigkeit jeder Bestimmung und hilft, echte Varianten von Sequenzierungsfehlern zu unterscheiden.