Secuenciación de ARN y Transcriptómica
La secuenciación de ARN (RNA-seq) determina la identidad y abundancia de moléculas de ARN en una muestra mediante secuenciación de alto rendimiento, proporcionando una imagen cuantitativa y a nivel de genoma de la expresión génica. La transcriptómica es el estudio de este conjunto completo de transcritos, el transcriptoma, y cómo cambia entre tejidos, condiciones y estados de enfermedad.
Definition
La secuenciación de ARN es un método que convierte el ARN en una biblioteca de fragmentos secuenciados y cuenta las lecturas mapeadas a genes o transcritos para cuantificar la expresión en todo el transcriptoma, el conjunto completo de moléculas de ARN presentes en una célula o tejido.
Scope
Este tema cubre cómo el RNA-seq convierte las lecturas de secuencia en estimaciones de expresión, el significado del transcriptoma como una lectura dinámica, las unidades de cuantificación comunes y los problemas de calidad y estandarización específicos de la medición basada en secuenciación. Trata el RNA-seq como una plataforma de medición y descubrimiento en lugar de un protocolo de prueba clínica.
Core questions
- ¿Cómo se convierten las lecturas de secuenciación en estimaciones de expresión cuantitativas?
- ¿Qué captura el transcriptoma más allá de una lista fija de genes?
- ¿Cómo afectan la normalización y la profundidad de lectura a la comparabilidad?
- ¿Cómo se evalúa la precisión y reproducibilidad del RNA-seq?
Key concepts
- Transcriptoma
- Mapeo y recuento de lecturas
- Normalización (p. ej., escalado por profundidad y longitud)
- Expresión diferencial
- Controles "spike-in"
- Transcriptómica de célula única y de masa
Mechanisms
El ARN se extrae, se transcribe inversamente a ADNc, se fragmenta y se prepara en una biblioteca de secuenciación; las lecturas resultantes se alinean con un genoma o transcriptoma de referencia, y el número de lecturas que se superponen a cada característica proporciona un recuento proporcional a su expresión (Mortazavi et al., 2008). Dado que la profundidad total de lectura y la longitud del transcrito influyen en los recuentos brutos, los datos se normalizan antes de que los transcritos puedan compararse, y la abundancia a menudo se expresa en unidades escaladas por longitud y profundidad. El RNA-seq puede detectar transcritos novedosos, variantes de empalme y un amplio rango dinámico de expresión, lo que lo distingue de los perfiles anteriores basados en hibridación (Wang et al., 2009). Se utilizan estándares externos de "spike-in" y la evaluación comparativa de consorcios para caracterizar la precisión y los límites de la plataforma (Jiang et al., 2011; SEQC/MAQC-III Consortium, 2014).
Clinical relevance
El RNA-seq sustenta cada vez más el perfil molecular de tumores, la detección de fusiones y la clasificación basada en la expresión, y la interpretación de dichos datos requiere comprender cómo los recuentos se convierten en estimaciones de expresión. Esta entrada describe el método y sus propiedades cuantitativas; no proporciona interpretaciones diagnósticas ni orientación de tratamiento, que se basan en ensayos validados y criterios clínicos.
Evidence & guidelines
Las descripciones fundamentales del RNA-seq como método cuantitativo (Mortazavi et al., 2008; Wang et al., 2009) se complementan con esfuerzos comunitarios sobre la precisión y la reproducibilidad, incluidos los estándares externos de "spike-in" (Jiang et al., 2011) y la evaluación comparativa del rendimiento del RNA-seq por el consorcio SEQC/MAQC-III (2014).
History
La medición del transcriptoma pasó de los enfoques de etiquetas de secuencia expresadas y microarrays a la secuenciación directa a finales de la década de 2000, cuando la secuenciación de próxima generación hizo práctico el recuento de lecturas de transcriptomas completos (Mortazavi et al., 2008). El RNA-seq se convirtió rápidamente en un estándar para los estudios de expresión, y el trabajo posterior del consorcio abordó cómo hacer que sus mediciones fueran comparables y reproducibles (SEQC/MAQC-III Consortium, 2014).
Debates
- ¿Cómo deben normalizarse los recuentos de RNA-seq para la comparación?
- Los recuentos brutos dependen de la profundidad de secuenciación y la longitud del transcrito, y diferentes opciones de normalización pueden cambiar qué genes aparecen diferencialmente expresados; la selección de una normalización y controles apropiados sigue siendo una preocupación metodológica.
Key figures
- Zhong Wang
- Michael Snyder
- Ali Mortazavi
- Barbara Wold
Related topics
Seminal works
- wang-2009
- mortazavi-2008
- seqc-2014
Frequently asked questions
- ¿Qué es el transcriptoma?
- El transcriptoma es el conjunto completo de transcritos de ARN presentes en una célula o tejido en un momento dado; debido a que cambia con la condición y el tipo de célula, su medición muestra qué genes están activos y en qué nivel.
- ¿En qué se diferencia el RNA-seq de los microarrays para la expresión?
- El RNA-seq secuencia y cuenta el ARN directamente, por lo que puede detectar transcritos novedosos y variantes de empalme y cubre un amplio rango dinámico, mientras que los microarrays miden la hibridación a sondas predefinidas y se limitan a secuencias conocidas.
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Differential single-cell RNA-seq analysis
- Multi-omics RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression