结构基因组学与结构变异
结构变异是一类遗传差异,其中DNA片段(通常大于单个碱基变化)被删除、重复、插入、倒位或易位,从而改变基因组片段的拷贝数、方向或位置。结构变异与染色体畸变(该领域由此发展而来)共同构成了任意两个人类基因组之间碱基对差异的很大一部分,并对正常变异和疾病都有显著贡献。
Definition
结构变异包括影响DNA片段的基因组改变——通常指约1千碱基或更大的片段,尽管现在检测范围已扩展到更小——包括缺失、重复、拷贝数变异、插入、倒位和易位,被视为单核苷酸变异和短插入缺失变异的补充。
Scope
本领域旨在引导读者了解基因组在片段而非单个核苷酸层面的变异方式。它涵盖了检测和分类拷贝数变异的操作要点、结构变异类型的目录及其产生的突变机制、易使特定基因组区域发生重复重排的重复结构(节段重复)、积极重塑基因组的移动元件,以及变异在群体层面的单倍型组织。它是一个参考性导向,而非临床指导。
Sub-topics
Core questions
- 存在哪些类型的结构变异,它们通过何种机制产生?
- 如何从基因组数据中检测、确定大小和分类拷贝数和结构变异?
- 基因组结构的哪些特征使特定区域易于发生重复重排?
- 结构变异如何在人群中分布并与单倍型结构相关联?
Key concepts
- 结构变异 (SV)
- 拷贝数变异 (CNV)
- 平衡与非平衡重排
- 复发性与非复发性变异
- 节段重复与基因组结构
- 移动元件插入
- 单倍型与连锁不平衡
Mechanisms
结构变异通过几种主要途径产生。基于重组的机制——主要是高度相似重复拷贝(如节段重复)之间的非等位同源重组——产生具有共享断裂点的重复缺失和重复。基于复制的机制,包括复制叉停滞和模板转换以及微同源介导的断裂诱导复制,产生非重复且通常复杂的重排。非同源末端连接以可能删除或插入序列的方式修复双链断裂,而逆转录转座将移动元件复制到新位点。这些过程改变拷贝数、序列方向或基因组位置,其“足迹”可通过测序和芯片数据回溯读取,以检测和分类变异。
Clinical relevance
结构变异是相当一部分遗传疾病的基础,从基因组结构介导的复发性微缺失和微重复综合征到癌症中的体细胞重排。了解如何检测和分类这些变异对于解释健康科学中的基因组发现至关重要。本领域描述了结构变异如何概念化和测量,并非个体诊断或治疗决策的依据。
Epidemiology
大型参考项目表明,结构变异虽然数量远少于单核苷酸变异,但影响了基因组之间更多的总碱基对差异。千人基因组结构变异图谱编目了来自多个群体的数千个个体中的数万个结构变异,建立了基线频率以及不同人类祖先中缺失、重复和移动元件插入的相对丰度。
History
大规模基因组变化的研究始于细胞遗传学和对可见染色体畸变的认识。21世纪的基于芯片和测序技术揭示,亚微观拷贝数和结构变异即使在健康个体中也普遍存在,将结构变异重新定义为基因组的常规组成部分,而非罕见的病理事件。来自HapMap和千人基因组项目以及专门的结构变异研究的参考目录随后将这种变异置于群体层面。
Debates
- 短读长测序能在多大程度上捕获结构变异?
- 短读长数据能很好地检测缺失和许多拷贝数变化,但系统性地遗漏了插入、倒位以及嵌入重复或重复区域的变异;该领域仍在争论,在长读长和基于组装的方法普遍应用之前,结构变异图谱的多少部分仍然隐藏。
Key figures
- Stephen W. Scherer
- Evan E. Eichler
- James R. Lupski
- Charles Lee
- Matthew Hurles
Related topics
Seminal works
- feuk-2006
- alkan-2011
- sudmant-2015
- 1000genomes-2015
Frequently asked questions
- 结构变异与单核苷酸变异有何不同?
- 单核苷酸变异改变一个碱基,而结构变异改变整个DNA片段——删除、重复、插入、倒位或重新定位它——因此它一次影响许多碱基,并通过不同的方法检测。
- 结构变异总是 Harmful 吗?
- 不。大多数结构变异是健康人携带的常见多态性;只有一小部分,通常涉及剂量敏感基因或特定基因组区域,与疾病相关。