节段重复和基因组疾病区域
节段重复(也称为低拷贝重复)是DNA片段,通常长度超过一千碱基,以两个或更多几乎相同的拷贝存在于不同的基因组位置。通过提供长段的高度序列同源性,它们充当非等位基因同源重组的底物,使它们侧翼的区域易于发生复发性缺失和重复,并产生一类可识别的由结构驱动的基因组疾病。
Definition
节段重复是DNA片段,通常长度超过一千碱基,共享超过约90%的序列同源性,在基因组中存在多个拷贝;当它们侧翼一个独特区域时,会形成一种使其易于发生复发性结构重排的结构。
Scope
本主题涵盖节段重复的定义、其长度和序列同源性如何使其成为重组底物,以及由此产生的复发性重排如何定义基因组疾病区域。它将基因组结构和重排易感性视为一个方法学和生物学主题;它不提供任何特定病症的诊断或管理指导。
Core questions
- 节段重复在长度和序列同源性方面是如何定义的?
- 侧翼重复如何介导复发性缺失和重复?
- 是什么使一个基因组区域成为复发的“重排热点”?
- 为什么复发性基因组疾病在不相关的个体之间共享断裂点?
Key concepts
- 节段重复 / 低拷贝重复
- 序列同源性阈值
- 非等位基因同源重组底物
- 复发性重排热点
- 互补缺失和重复
- 基因组疾病区域
- 基因组结构
Key theories
- 结构驱动的复发性重排
- 由直接定向的节段重复侧翼的区域易于通过侧翼重复之间的非等位基因同源重组发生复发性缺失和互补重复,因此断裂点在独立的病例中会在重复内部复发。
Mechanisms
节段重复之所以重要,是因为它们的序列特性。当两个拷贝长且高度同源,并以相同方向位于独特间隔的两侧时,重组机制可能会使它们错位——将一个拷贝与另一个拷贝配对,而不是与其真正的等位基因配对——并解决交叉,从而使中间区域在一个产物上被删除,在互补产物上被重复。由于断裂点落在重复本身内部,相同的缺失和重复会在不相关的个体中复发,产生具有结构丰富区域特征的复发性基因组疾病的互补对。
Clinical relevance
复发性微缺失和微重复疾病聚集在由节段重复包围的区域,这就是为什么在解释健康科学中的结构发现时,基因组结构具有信息性。本条目描述了复发性重排的结构基础作为一个参考概念,而不是个体诊断或治疗的基础。
Epidemiology
Bailey及其同事进行的全基因组分析发现,近期发生的节段重复约占人类基因组的5%,并且分布不随机,集中在着丝粒附近以及亚端粒和着丝粒周围区域。它们的分布与已知复发性基因组疾病的位置密切对应,反映了对侧翼重复的共同机制依赖性。
History
随着人类基因组的组装,Bailey、Eichler及其同事量化了节段重复,并表明它们是基因组中一个重要的、结构化的组成部分。与此同时,Lupski和Stankiewicz发展了结构驱动的基因组疾病概念,解释了为什么某些缺失和重复会复发。这些研究共同确立了基因组结构而非偶然性,决定了许多复发性结构变异的发生位置。
Key figures
- Evan E. Eichler
- Jeffrey A. Bailey
- James R. Lupski
- Paweł Stankiewicz
- Stephen W. Scherer
Related topics
Seminal works
- bailey-2002
- stankiewicz-2010
Frequently asked questions
- 为什么节段重复与复发性遗传疾病相关联?
- 它们长而几乎相同的拷贝充当非等位基因同源重组的底物,因此由它们侧翼的区域会以相同的断裂点反复缺失或重复,从而在不相关的个体之间产生复发性重排。
- 节段重复与串联重复或转座元件有何不同?
- 节段重复是复制到另一个位置的大块(通常超过一千碱基)高同源性序列;串联重复是首尾相连重复的短基序,而转座元件是通过专门机制移动和复制自身的移动序列。