Estándares y Anotación del Genoma de Referencia
Un genoma de referencia es una secuencia de consenso representativa y curada para una especie que sirve como sistema de coordenadas compartido contra el cual se alinean e interpretan los nuevos datos de secuencia. Mantenerlo como versiones construidas y superponerle anotaciones biológicas es lo que hace que los resultados genómicos sean comparables entre estudios, laboratorios y a lo largo del tiempo.
Definition
Un genoma de referencia es una secuencia de nucleótidos de consenso curada, elegida para representar el genoma de una especie, mantenida como ensamblajes versionados (construcciones) y anotada con las ubicaciones de genes y otros elementos funcionales, que proporciona un marco de coordenadas estable para alinear e interpretar datos genómicos.
Scope
La entrada cubre qué es un ensamblaje de referencia, cómo se versiona en construcciones sucesivas (como el ensamblaje humano GRCh38 y el ensamblaje de telómero a telómero), el papel de la anotación en la marcación de genes y características funcionales, y el avance hacia referencias más completas y representativas. Es un tema de referencia e infraestructura, no una guía clínica.
Core questions
- ¿Qué es un genoma de referencia y por qué el campo se estandariza en uno?
- ¿Cómo y por qué se versionan los ensamblajes de referencia en construcciones sucesivas?
- ¿Qué añade la anotación genómica a una secuencia de referencia?
Key concepts
- Ensamblaje de referencia (secuencia de consenso)
- Construcción y versionado del genoma (p. ej., GRCh38)
- Anotación del genoma
- Sistema de coordenadas para alineación
- Ensamblaje de telómero a telómero (sin huecos)
- Huecos de ensamblaje y finalización
Mechanisms
Un genoma de referencia se ensambla a partir de datos de secuencia de alta calidad en un consenso que representa a la especie en lugar de a un solo individuo, luego se lanza como una construcción versionada para que las coordenadas genómicas permanezcan estables y citables. La anotación superpone la secuencia con las posiciones de genes, transcritos y elementos reguladores y repetitivos, convirtiendo las coordenadas crudas en mapas biológicamente interpretables. Las construcciones sucesivas incorporan correcciones, llenan huecos y mejoran la representación; la referencia humana progresó desde el borrador de 2001 y la secuencia eucromática terminada de 2004 hasta la construcción GRCh38 y, finalmente, hasta un ensamblaje completo de telómero a telómero que resolvió regiones previamente inaccesibles.
Clinical relevance
Dado que la identificación e interpretación de variantes se expresan en coordenadas de referencia, la elección y la versión del genoma de referencia afectan directamente cómo se informan y comparan los hallazgos genómicos. Esta entrada describe la infraestructura de referencia como material educativo y no es una base para decisiones clínicas o diagnósticas individuales.
Evidence & guidelines
La referencia se documenta a través de informes primarios de consorcios y evaluaciones de ensamblajes en lugar de guías clínicas: el borrador inicial (2001) y la secuencia eucromática terminada (2004), la evaluación de la construcción GRCh38 (Schneider et al., 2017), y el genoma humano completo de telómero a telómero (Nurk et al., 2022) definen el estándar actual y su trayectoria.
History
El genoma de referencia humano comenzó con la secuencia borrador de 2001 y la secuencia eucromática terminada de 2004, luego fue mantenido y mejorado por el Consorcio de Referencia del Genoma a través de construcciones sucesivas que culminaron en GRCh38. Los huecos persistentes en las regiones repetitivas y centroméricas fueron finalmente cerrados por el consorcio de telómero a telómero, que produjo el primer genoma humano completo y sin huecos en 2022 y redefinió lo que un estándar de referencia puede ser.
Key figures
- Deanna Church
- Valerie Schneider
- Adam Phillippy
- Karen Miga
Related topics
Seminal works
- ihgsc-2004
- schneider-2017
- nurk-2022-ref
Frequently asked questions
- ¿Por qué un genoma de referencia tiene diferentes versiones o construcciones?
- A medida que la secuenciación y el ensamblaje mejoran, la referencia se revisa para corregir errores, cerrar huecos y representar mejor a la especie; a cada lanzamiento se le asigna una versión de construcción para que las coordenadas genómicas permanezcan estables y los resultados sigan siendo comparables.
- ¿Qué es la anotación genómica?
- La anotación es el proceso de marcar dónde se encuentran los genes, transcritos, elementos reguladores y otras características en la secuencia de referencia, convirtiendo una cadena de nucleótidos en un mapa biológicamente interpretable.