Kopienzahlvarianten: Nachweis und Klassifizierung
Eine Kopienzahlvariante (CNV) ist ein DNA-Segment, das zwischen Individuen in einer unterschiedlichen Anzahl von Kopien vorliegt – entweder durch Duplikation gewonnen oder durch Deletion im Vergleich zu einem Referenzgenom verloren. CNVs sind ein Hauptbestandteil der strukturellen Variation, und die zentralen methodischen Fragen sind, wie sie zuverlässig aus Array- oder Sequenzierungsdaten nachgewiesen und nach Größe, Kopienzustand und wahrscheinlicher Signifikanz klassifiziert werden können.
Definition
Eine Kopienzahlvariante ist ein DNA-Segment, konventionell von einem Kilobase oder größer, das sich in der Anzahl der vorhandenen Kopien im Vergleich zu einem Referenzgenom unterscheidet und als Deletion (Kopienverlust) oder als Duplikation oder Amplifikation höherer Ordnung (Kopiengewinn) entsteht.
Scope
Dieses Thema behandelt, was eine CNV ist, die wichtigsten Technologien, die zu ihrem Nachweis und ihrer Größenbestimmung verwendet werden (Array-vergleichende genomische Hybridisierung, SNP-Arrays und Read-Depth- oder Paired-End-Signale aus der Sequenzierung), und die Grundlagen, auf denen sie klassifiziert werden – Gewinn versus Verlust, Kopienzahl, Rekurrenz und Frequenz. Es handelt sich um eine referenzielle Behandlung von Nachweis- und Klassifizierungskonzepten und bietet keine diagnostische Interpretation für Einzelpersonen.
Core questions
- Was unterscheidet eine Kopienzahlvariante von anderen strukturellen Varianten?
- Welche Signale – Hybridisierungsintensität, Read-Tiefe, Paired-End- und Split-Read-Beweise – werden verwendet, um CNVs zu bestimmen?
- Wie werden CNVs nach Kopienzustand, Größe, Rekurrenz und Populationsfrequenz klassifiziert?
- Was sind die Auflösungsgrenzen und Quellen für Fehlbestimmungen jeder Nachweisplattform?
Key concepts
- Kopiengewinn (Duplikation) und Kopienverlust (Deletion)
- Array-vergleichende genomische Hybridisierung (aCGH)
- SNP-Array Log R Verhältnis und B-Allel-Frequenz
- Read-Depth- und Paired-End-Nachweis
- Bruchpunktauflösung
- Rekurrente vs. nicht-rekurrente CNV
- Populationsfrequenz und gutartige vs. pathogene Klassifizierung
Mechanisms
Der CNV-Nachweis übersetzt eine physikalische Änderung der DNA-Dosierung in ein messbares Signal. Array-vergleichende genomische Hybridisierung und SNP-Arrays lesen die relative Hybridisierungsintensität, sodass eine Deletion das Signal über das betroffene Intervall senkt und eine Duplikation es erhöht; SNP-Arrays fügen Allelverhältnisinformationen hinzu, die helfen, Kopienzustände zu unterscheiden. Sequenzierungsbasierte Ansätze leiten die Kopienzahl aus der Read-Tiefe ab – mehr Reads akkumulieren über duplizierten Regionen und weniger über Deletionen – und verwenden diskordante Paired-End- und Split-Read-Alignments, um Bruchpunkte zu lokalisieren. Die Klassifizierung kombiniert dann den Kopienzustand, die Größe, ob die Variante an architekturdefinierten Bruchpunkten wiederkehrt, und ihre Frequenz in Referenzpopulationen.
Clinical relevance
Die Kopienzahlanalyse wird in den Gesundheitswissenschaften weit verbreitet eingesetzt, um genomische Gewinne und Verluste zu charakterisieren, und die Unterscheidung zwischen häufigen gutartigen CNVs und seltenen dosisverändernden Ereignissen ist zentral für die Interpretation genomischer Daten. Dieser Eintrag beschreibt, wie CNVs als methodische Angelegenheit nachgewiesen und kategorisiert werden; er ist keine Grundlage für eine individuelle Diagnose oder Behandlung.
Epidemiology
Frühe genomweite Untersuchungen zeigten, dass CNVs bei gesunden Individuen häufig sind: Sebat und Kollegen zeigten erstmals eine weit verbreitete Kopienzahlpolymorphismus, und Redon und Kollegen kartierten globale CNV über HapMap-Populationen. Nachfolgende sequenzierungsbasierte Kataloge, einschließlich der 1000 Genomes Strukturvariationskarte, verfeinerten die Frequenzen und zeigten, dass Deletionen und Duplikationen zusammen einen großen Teil des variablen Genoms umfassen.
History
Die Erkenntnis, dass die Kopienzahl bei gesunden Menschen stark variiert, entstand 2004 aus Array-Studien von Sebat und von Iafrate und Kollegen, was die Annahme, dass solche Variationen selten seien, umstieß. Ganzgenom-CNV-Karten von Array-Plattformen folgten 2006, und die Umstellung auf Hochdurchsatzsequenzierung im folgenden Jahrzehnt brachte Read-Depth- und Paired-End-Methoden mit sich, die die Bruchpunktauflösung verbesserten und die CNV-Bestimmung in die allgemeine Entdeckung struktureller Varianten integrierten.
Debates
- Wie sollten Unterschiede zwischen Nachweisplattformen in Einklang gebracht werden?
- Arrays und sequenzierungsbasierte Caller melden überlappende, aber nicht identische CNV-Sätze, die sich in der Größenauflösung, der Bruchpunktpräzision und der Sensitivität in repetitiven Regionen unterscheiden, sodass die Harmonisierung von Bestimmungen und Frequenzen über Plattformen hinweg eine anerkannte methodische Herausforderung bleibt.
Key figures
- Jonathan Sebat
- Stephen W. Scherer
- Charles Lee
- Evan E. Eichler
- Nigel P. Carter
Related topics
Seminal works
- sebat-2004
- redon-2006
- alkan-2011
Frequently asked questions
- Was ist der Unterschied zwischen einer CNV und einer Deletion?
- Eine Deletion ist eine Art von Kopienzahlvariante (ein Kopienverlust). Der Begriff CNV ist breiter gefasst und umfasst auch Duplikationen und Kopiengewinne höherer Ordnung, sodass jede Deletion der relevanten Größe eine CNV ist, aber nicht jede CNV eine Deletion.
- Warum können zwei Plattformen unterschiedliche CNVs für dieselbe Probe melden?
- Array- und Sequenzierungsmethoden unterscheiden sich in Auflösung, Bruchpunktpräzision und Sensitivität innerhalb repetitiver Regionen, sodass sie überlappende, aber nicht identische Sätze von Varianten erfassen und dasselbe Ereignis unterschiedlich groß bestimmen können.
Methods for this concept
- Copy Number Variation Analysis
- Machine learning-assisted copy number variation analysis
- Bayesian Copy Number Variation Analysis
- Differential Copy Number Variation Analysis
- Single-cell Copy Number Variation Analysis
- Variant Calling
- Time-series copy number variation analysis
- Network-based copy number variation analysis