Variantes del número de copias: Detección y clasificación
Una variante del número de copias (VNC) es un segmento de ADN que está presente en un número diferente de copias entre individuos, ya sea ganado por duplicación o perdido por deleción en relación con un genoma de referencia. Las VNC son un componente principal de la variación estructural, y las preguntas metodológicas centrales son cómo detectarlas de manera fiable a partir de datos de matrices o secuenciación y cómo clasificarlas por tamaño, estado de copia y probable significación.
Definition
Una variante del número de copias es un segmento de ADN, convencionalmente de un kilobase o más, que difiere en el número de copias presentes en comparación con un genoma de referencia, surgiendo como una deleción (pérdida de copia) o una duplicación o amplificación de orden superior (ganancia de copia).
Scope
Este tema aborda qué es una VNC, las principales tecnologías utilizadas para detectarlas y determinar su tamaño (hibridación genómica comparada en matrices, matrices de SNP y señales de profundidad de lectura o de extremos apareados de la secuenciación), y las bases sobre las que se clasifican: ganancia frente a pérdida, número de copias, recurrencia y frecuencia. Se trata de un tratamiento de referencia de los conceptos de detección y clasificación y no proporciona interpretación diagnóstica para individuos.
Core questions
- ¿Qué distingue una variante del número de copias de otras variantes estructurales?
- ¿Qué señales —intensidad de hibridación, profundidad de lectura, evidencia de extremos apareados y de lectura dividida— se utilizan para identificar VNC?
- ¿Cómo se clasifican las VNC por estado de copia, tamaño, recurrencia y frecuencia poblacional?
- ¿Cuáles son los límites de resolución y las fuentes de falsos positivos de cada plataforma de detección?
Key concepts
- Ganancia de copia (duplicación) y pérdida de copia (deleción)
- Hibridación genómica comparada en matrices (aCGH)
- Relación log R de matriz de SNP y frecuencia del alelo B
- Detección por profundidad de lectura y extremos apareados
- Resolución de puntos de ruptura
- VNC recurrente frente a no recurrente
- Frecuencia poblacional y clasificación benigna frente a patogénica
Mechanisms
La detección de VNC traduce un cambio físico en la dosificación del ADN en una señal medible. La hibridación genómica comparada en matrices y las matrices de SNP leen la intensidad de hibridación relativa, de modo que una deleción disminuye y una duplicación aumenta la señal a lo largo del intervalo afectado; las matrices de SNP añaden información de la relación alélica que ayuda a distinguir los estados de copia. Los enfoques basados en secuenciación infieren el número de copias a partir de la profundidad de lectura —más lecturas se acumulan sobre regiones duplicadas y menos sobre deleciones— y utilizan alineamientos de extremos apareados discordantes y de lectura dividida para localizar los puntos de ruptura. La clasificación combina entonces el estado de copia, el tamaño, si la variante se repite en puntos de ruptura definidos por la arquitectura y su frecuencia en poblaciones de referencia.
Clinical relevance
El análisis del número de copias se utiliza ampliamente en las ciencias de la salud para caracterizar las ganancias y pérdidas genómicas, y distinguir las VNC benignas comunes de los eventos raros que alteran la dosificación es fundamental para interpretar los datos genómicos. Esta entrada describe cómo se detectan y categorizan las VNC como una cuestión metodológica; no constituye una base para el diagnóstico o manejo individual.
Epidemiology
Los primeros estudios a escala genómica establecieron que las VNC son comunes en individuos sanos: Sebat y sus colegas mostraron por primera vez un polimorfismo generalizado del número de copias, y Redon y sus colegas mapearon las VNC globales en las poblaciones de HapMap. Los catálogos posteriores basados en secuenciación, incluido el mapa de variación estructural de 1000 Genomas, refinaron las frecuencias y mostraron que las deleciones y duplicaciones abarcan colectivamente una gran parte del genoma variable.
History
El reconocimiento de que el número de copias varía ampliamente entre personas sanas surgió en 2004 de estudios de matrices realizados por Sebat y por Iafrate y sus colegas, lo que derrocó la suposición de que dicha variación era rara. Los mapas de VNC de genoma completo de plataformas de matrices siguieron en 2006, y el cambio a la secuenciación de alto rendimiento en la década siguiente trajo métodos de profundidad de lectura y de extremos apareados que mejoraron la resolución de los puntos de ruptura e integraron la detección de VNC en el descubrimiento general de variantes estructurales.
Debates
- ¿Cómo deben conciliarse las diferencias entre plataformas de detección?
- Los detectores basados en matrices y en secuenciación informan conjuntos de VNC superpuestos pero no idénticos, que difieren en la resolución del tamaño, la precisión de los puntos de ruptura y la sensibilidad en regiones repetitivas, por lo que la armonización de las detecciones y frecuencias entre plataformas sigue siendo un desafío metodológico reconocido.
Key figures
- Jonathan Sebat
- Stephen W. Scherer
- Charles Lee
- Evan E. Eichler
- Nigel P. Carter
Related topics
Seminal works
- sebat-2004
- redon-2006
- alkan-2011
Frequently asked questions
- ¿Cuál es la diferencia entre una VNC y una deleción?
- Una deleción es un tipo de variante del número de copias (una pérdida de copia). El término VNC es más amplio y también incluye duplicaciones y ganancias de copia de orden superior, por lo que cada deleción del tamaño relevante es una VNC, pero no toda VNC es una deleción.
- ¿Por qué dos plataformas pueden informar VNC diferentes para la misma muestra?
- Los métodos de matrices y de secuenciación difieren en resolución, precisión de los puntos de ruptura y sensibilidad dentro de regiones repetitivas, por lo que capturan conjuntos de variantes superpuestos pero no idénticos y pueden determinar el tamaño del mismo evento de manera diferente.
Methods for this concept
- Copy Number Variation Analysis
- Machine learning-assisted copy number variation analysis
- Bayesian Copy Number Variation Analysis
- Differential Copy Number Variation Analysis
- Single-cell Copy Number Variation Analysis
- Variant Calling
- Time-series copy number variation analysis
- Network-based copy number variation analysis