RNA测序方法与技术
RNA测序(RNA-seq)通过将RNA转化为测序文库并计数映射回基因和转录本的读段,来测量转录组。通过直接对转录本进行采样,而不是将其与预定义的探针杂交,RNA-seq可以在宽广的动态范围内量化表达,发现以前未注释的转录本和剪接连接点,并解析异构体结构。
Definition
RNA测序是一种高通量测序方法,其中RNA被逆转录(或直接测序),并将产生的读段进行比对和计数,以量化转录本丰度并表征转录组中的转录本结构。
Scope
本主题涵盖RNA-seq的实验和计算工作流程:RNA选择和文库制备、短读长和长读长测序化学、读段比对或伪比对,以及表达的量化和标准化。它是转录组学领域的方法学参考,不提供临床指导。
Core questions
- RNA样本如何转化为测序文库,以及哪些选择步骤(poly-A或核糖体耗尽)决定了测量内容?
- 读段如何与参考序列比对或伪比对,并按基因或转录本进行量化?
- 如何进行标准化,以便在不同样本之间比较表达?
- 长读长和直接RNA技术相对于短读长测序增加了哪些功能?
Key concepts
- 文库制备和poly-A选择或rRNA耗尽
- 短读长与长读长测序
- 读段比对和伪比对
- 读段计数和量化
- 标准化(例如,FPKM/TPM等单位)
- 测序深度和覆盖度
- 剪接连接点检测
- 直接RNA测序
Mechanisms
在典型的工作流程中,提取RNA并选择一部分(通常是聚腺苷酸化的信使RNA,或核糖体RNA耗尽后的总RNA),然后将其片段化,逆转录为互补DNA,并构建成带有接头的文库。对文库进行测序以产生数百万个读段,这些读段被比对到参考基因组或转录组,或通过免比对的伪比对进行量化。重叠每个特征的读段被计数;由于较长的转录本和测序深度较高的样本会累积更多的读段,因此在比较丰度之前,会根据转录本长度和文库大小对计数进行标准化。Mortazavi及其同事引入了核心的计数和标准化框架,Wang和Ozsolak的综述阐述了该平台的优势和局限性。长读长和直接RNA技术对全长分子进行测序,提高了异构体分辨率,但代价是每个读段的错误率更高且通量较低。
Clinical relevance
RNA-seq在研究和转化基因组学中产生了大量的分子分类和生物标志物发现证据,并日益支持诊断性转录本和融合基因的检测。作为一个参考主题,它解释了转录组学证据是如何产生的;它不是个体诊断或治疗决策的基础。
Evidence & guidelines
RNA-seq的最佳实践框架源于Mortazavi及其同事的基础量化工作以及方法学综述(Wang及其同事;Ozsolak和Milos)。长读长分析有其自身的考量,Amarasinghe及其同事对此进行了调查。这些是方法学参考,而非临床实践指南。
History
RNA-seq于2008年出现,当时高通量短读长测序被应用于逆转录RNA,Mortazavi及其同事建立了如何从读段计数中绘制和量化哺乳动物转录组的方法。随后几年的综述巩固了文库制备和分析标准,从2010年代中期开始,长读长和直接RNA平台将该方法扩展到全长异构体测序。
Debates
- 短读长与长读长测序
- 短读长测序提供高通量和低碱基错误率,但只能间接重建异构体,而长读长测序对全长转录本进行测序,直接解析异构体,但代价是错误率更高且深度较低;适当的选择取决于准确量化或异构体结构是否是优先考虑事项。
Key figures
- Barbara Wold
- Ali Mortazavi
- Michael Snyder
Related topics
Seminal works
- mortazavi-2008
- wang-2009
- ozsolak-2011
Frequently asked questions
- poly-A选择和核糖体RNA耗尽有什么区别?
- poly-A选择捕获聚腺苷酸化信使RNA,对蛋白质编码转录本有效,而核糖体RNA耗尽则去除丰富的rRNA,同时保留非聚腺苷酸化和降解的转录本。选择哪种方法决定了实验可以测量哪些RNA种类。
- 为什么RNA-seq计数在比较前需要标准化?
- 原始读段计数取决于转录本长度和每个样本的测序深度,因此不能直接比较。标准化可以调整这些因素,使丰度差异反映生物学而非技术深度或长度。
Methods for this concept
- RNA-seq Differential Expression
- Single-cell RNA-seq analysis
- De Novo Transcriptome Assembly
- Bayesian RNA-seq differential expression
- Time-series single-cell RNA-seq analysis
- Differential single-cell RNA-seq analysis
- Single-cell RNA-seq differential expression
- Machine learning-assisted RNA-seq differential expression