全基因组测序
全基因组测序(WGS)通过一次实验确定生物体基因组的近乎完整的核苷酸序列,而不是针对选定的基因或区域。通过读取编码和非编码DNA,它提供了最全面的原始基因组数据集,并作为组装、变异检测和下游基因组分析的输入。
Definition
全基因组测序是一种实验室和计算过程,旨在确定生物体基因组中几乎所有核苷酸的顺序,通常通过将DNA片段化、以冗余覆盖度读取这些片段,并对其进行重建或比对以恢复完整序列。
Scope
本条目涵盖了WGS的测量内容、通过高覆盖度对基因组进行片段化和读取的鸟枪法策略、与全外显子组测序等靶向方法的对比,以及测序深度在确定灵敏度方面的作用。这是一个方法学主题,不提供临床或检测建议。
Core questions
- 全基因组测序捕获了哪些靶向测序未能捕获的信息?
- 鸟枪法策略如何从许多短片段中重建整个基因组?
- 测序深度如何影响可检测到的变异?
Key concepts
- 鸟枪法测序
- 测序深度和覆盖度
- 全基因组测序与全外显子组测序
- 编码区和非编码区
- 可逆终止子化学
- 变异检测输入
Mechanisms
在WGS中,基因组DNA被片段化并多次读取,以便每个位置都被多个独立读取覆盖;冗余度(深度)允许对碱基识别进行交叉检查并支持变异的检测。由Venter及其同事在人类规模上展示的全基因组鸟枪法,将基因组分解成随机片段,对其进行测序,并通过计算重新组装。可逆终止子化学方法后来使得以更低的成本对整个人类基因组进行准确的大规模并行读取成为可能。由于WGS读取非编码和编码DNA,它捕获了靶向检测方法所遗漏的调控和结构变异。
Clinical relevance
全基因组测序在研究和临床基因组学中越来越多地用于表征个体的完整遗传构成,支持在编码和非编码区域发现变异。本条目描述了该方法及其数据特征;它属于教育参考材料,并非针对任何特定检测或临床行动的建议。
Evidence & guidelines
基础证据是一系列里程碑式的原始研究:2001年发表的两个人类基因组序列(Venter等人;国际人类基因组测序联盟)以及Bentley等人(2008年)对准确大规模并行全基因组测序的演示。Sims等人(2014年)等方法学综述记录了深度和覆盖度如何影响分析灵敏度。
History
人类规模的全基因组测序于2001年首次实现,通过两项并行工作:一项使用分层克隆测序,另一项使用全基因组鸟枪法组装。2008年,可逆终止子化学方法实现准确测序的演示使得群体规模的WGS成为可能,随着该方法的成熟,深度和覆盖度成为核心设计参数。
Key figures
- J. Craig Venter
- Eric Lander
- David Bentley
Related topics
Seminal works
- venter-2001
- ihgsc-2001-wgs
- bentley-2008
Frequently asked questions
- 全基因组测序与全外显子组测序有何不同?
- 全基因组测序读取几乎整个基因组,包括非编码区和调控区,而全外显子组测序仅针对蛋白质编码部分(外显子组),这只占基因组的一小部分。
- 为什么测序深度在全基因组测序中很重要?
- 深度(每个位置被多少次读取覆盖)决定了碱基识别和变异检测的置信度;更高的深度可以提高灵敏度和准确性,特别是对于检测低频率或杂合变异。