RNA测序和转录组学
RNA测序(RNA-seq)通过高通量测序确定样本中RNA分子的种类和丰度,从而提供基因表达的定量、全基因组图景。转录组学是研究这种完整的转录本集合(即转录组)及其在不同组织、条件和疾病状态下如何变化的学科。
Definition
RNA测序是一种将RNA转化为测序片段文库,并计数映射到基因或转录本的读数,以量化细胞或组织中所有RNA分子(即转录组)表达的方法。
Scope
本主题涵盖RNA-seq如何将测序读数转化为表达估计值,转录组作为动态读数的意义,常见的定量单位,以及测序测量特有的质量和标准化问题。它将RNA-seq视为一种测量和发现平台,而非临床检测方案。
Core questions
- 测序读数如何转化为定量的表达估计值?
- 转录组除了固定的基因列表之外还捕获了什么?
- 标准化和读数深度如何影响可比性?
- 如何评估RNA-seq的准确性和可重复性?
Key concepts
- 转录组
- 读数比对和计数
- 标准化(例如深度和长度缩放)
- 差异表达
- 掺入对照
- 单细胞和批量转录组学
Mechanisms
提取RNA,逆转录为cDNA,片段化并制备成测序文库;将所得读数与参考基因组或转录组比对,每个特征重叠的读数数量提供与其表达成比例的计数(Mortazavi et al., 2008)。由于总读数深度和转录本长度会影响原始计数,因此在比较转录本之前需要对数据进行标准化,丰度通常以长度和深度缩放的单位表示。RNA-seq可以检测新的转录本、剪接变体和广泛的动态表达范围,这使其与早期的基于杂交的分析方法有所不同(Wang et al., 2009)。外部掺入标准品和联盟基准测试用于表征该平台的准确性和局限性(Jiang et al., 2011; SEQC/MAQC-III Consortium, 2014)。
Clinical relevance
RNA-seq日益成为分子肿瘤分析、融合检测和基于表达分类的基础,解释这些数据需要理解计数如何转化为表达估计值。本条目描述了该方法及其定量特性;它不提供诊断解释或治疗指导,这些依赖于经过验证的检测和临床标准。
Evidence & guidelines
RNA-seq作为一种定量方法的基础性描述(Mortazavi et al., 2008; Wang et al., 2009)得到了社区在准确性和可重复性方面努力的补充,包括外部掺入标准品(Jiang et al., 2011)和SEQC/MAQC-III对RNA-seq性能的基准测试(2014)。
History
转录组测量方法从表达序列标签和微阵列方法转向直接测序发生在2000年代后期,当时下一代测序使得全转录组读数计数变得实用(Mortazavi et al., 2008)。RNA-seq迅速成为表达研究的标准,随后的联盟工作解决了如何使其测量结果具有可比性和可重复性(SEQC/MAQC-III Consortium, 2014)。
Debates
- RNA-seq计数应如何标准化以进行比较?
- 原始计数取决于测序深度和转录本长度,不同的标准化选择可能会改变哪些基因表现出差异表达;选择合适的标准化和对照仍然是一个方法学问题。
Key figures
- Zhong Wang
- Michael Snyder
- Ali Mortazavi
- Barbara Wold
Related topics
Seminal works
- wang-2009
- mortazavi-2008
- seqc-2014
Frequently asked questions
- 什么是转录组?
- 转录组是细胞或组织在特定时间点存在的所有RNA转录本的完整集合;因为它随条件和细胞类型而变化,测量它可以显示哪些基因是活跃的以及活跃程度。
- RNA-seq与微阵列在表达分析方面有何不同?
- RNA-seq直接测序和计数RNA,因此它可以检测新的转录本和剪接变体,并覆盖广泛的动态范围,而微阵列测量与预定义探针的杂交,并且仅限于已知序列。
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Differential single-cell RNA-seq analysis
- Multi-omics RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression