ScholarGate
助手

拷贝数变异:检测与分类

拷贝数变异(CNV)是指DNA片段在个体间拷贝数不同——相对于参考基因组,通过重复获得或通过缺失丢失。CNV是结构变异的主要组成部分,其核心方法学问题是如何从芯片或测序数据中可靠地检测它们,以及如何根据大小、拷贝状态和可能的显著性对其进行分类。

用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
下载幻灯片
Learn & explore
视频即将推出

Definition

拷贝数变异是指DNA片段,通常为1千碱基或更大,其拷贝数与参考基因组相比有所不同,表现为缺失(拷贝丢失)或重复或更高阶扩增(拷贝获得)。

Scope

本主题涵盖了CNV的定义、用于检测和确定其大小的主要技术(阵列比较基因组杂交、SNP芯片以及测序的读长深度或配对末端信号),以及对其进行分类的依据——获得与丢失、拷贝数、复发性和频率。这是一篇关于检测和分类概念的参考性论述,不提供个体诊断解释。

Core questions

  • 拷贝数变异与其他结构变异有何区别?
  • 哪些信号——杂交强度、读长深度、配对末端和断裂读长证据——用于识别CNV?
  • CNV如何根据拷贝状态、大小、复发性和人群频率进行分类?
  • 每个检测平台的解析度限制和假阳性来源是什么?

Key concepts

  • 拷贝获得(重复)和拷贝丢失(缺失)
  • 阵列比较基因组杂交(aCGH)
  • SNP芯片log R比率和B等位基因频率
  • 读长深度和配对末端检测
  • 断点分辨率
  • 复发性与非复发性CNV
  • 人群频率以及良性与致病性分类

Mechanisms

CNV检测将DNA剂量的物理变化转化为可测量的信号。阵列比较基因组杂交和SNP芯片读取相对杂交强度,因此缺失会降低信号,而重复会提高受影响区域的信号;SNP芯片增加了等位基因比率信息,有助于区分拷贝状态。基于测序的方法从读长深度推断拷贝数——重复区域积累更多读长,缺失区域积累更少读长——并使用不一致的配对末端和断裂读长比对来定位断点。分类则结合了拷贝状态、大小、变异是否在结构定义的断点处复发以及其在参考人群中的频率。

Clinical relevance

拷贝数分析在健康科学中广泛用于表征基因组的获得和丢失,区分常见的良性CNV与罕见的剂量改变事件是解释基因组数据的核心。本条目描述了CNV作为方法学问题如何被检测和分类;它不作为个体诊断或管理的依据。

Epidemiology

早期的全基因组调查表明CNV在健康个体中很常见:Sebat及其同事首次展示了广泛的拷贝数多态性,Redon及其同事绘制了HapMap人群的全球CNV图谱。随后的基于测序的目录,包括千人基因组结构变异图谱,细化了频率并表明缺失和重复共同占据了可变基因组的很大一部分。

History

2004年,Sebat和Iafrate及其同事的芯片研究揭示了健康人群中拷贝数广泛变异,推翻了此类变异罕见的假设。2006年,基于芯片平台的CNV全基因组图谱相继问世,随后十年高通量测序的兴起带来了读长深度和配对末端方法,这些方法提高了断点分辨率,并将CNV识别纳入了一般的结构变异发现。

Debates

如何协调检测平台之间的差异?
芯片和基于测序的识别器报告的CNV集存在重叠但不完全相同,在大小分辨率、断点精度和重复区域敏感性方面存在差异,因此协调跨平台的识别结果和频率仍然是一个公认的方法学挑战。

Key figures

  • Jonathan Sebat
  • Stephen W. Scherer
  • Charles Lee
  • Evan E. Eichler
  • Nigel P. Carter

Related topics

Seminal works

  • sebat-2004
  • redon-2006
  • alkan-2011

Frequently asked questions

CNV和缺失有什么区别?
缺失是一种拷贝数变异(拷贝丢失)。CNV这个术语更广泛,也包括重复和更高阶的拷贝获得,因此相关大小的每个缺失都是CNV,但并非每个CNV都是缺失。
为什么两个平台对同一样本报告的CNV可能不同?
芯片和测序方法在分辨率、断点精度和重复区域内的敏感性方面存在差异,因此它们捕获的变异集存在重叠但不完全相同,并且可能对同一事件的大小进行不同的评估。

Methods for this concept

Related concepts