连锁不平衡
连锁不平衡是指在一个群体中,不同基因座上等位基因的非随机关联:当邻近基因座上的特定等位基因共同出现的频率与其各自频率的乘积相比,或多或少。这是一种群体水平的模式,不同于家族水平的连锁,正是这种特性使得全基因组关联研究能够使用一小组标记来标记基因组中大得多的区域。
Definition
连锁不平衡(LD)是群体中两个或多个基因座上等位基因之间的统计关联,使得单倍型的频率不同于组成等位基因频率的乘积;它通过D、D-prime和r平方等度量进行量化。
Scope
本条目涵盖了连锁不平衡的定义和测量方法、产生和消除连锁不平衡的因素、其在单倍型区块中的组织方式,以及其在复杂性状关联定位中的应用。这是一个群体遗传学和医学遗传学中的参考主题,不提供临床指导。
Core questions
- 连锁不平衡与遗传连锁有何不同?
- 什么因素产生连锁不平衡,什么因素又会将其分解?
- 如何测量连锁不平衡,为什么其结构会形成单倍型区块?
- 关联研究如何利用连锁不平衡来寻找疾病基因座?
Key concepts
- 非随机等位基因关联
- LD的测量(D、D-prime、r平方)
- 单倍型和单倍型区块
- 重组与LD的衰减
- 标签SNP
- 全基因组关联研究(GWAS)
Mechanisms
连锁不平衡是在特定染色体背景上出现新等位基因并共同遗传时产生的,并通过群体历史(如瓶颈效应、混合、漂变和选择)得到强化。重组会在几代内分解LD:两个基因座越近,它们之间发生的交换越少,其关联衰减得越慢,因此LD往往在邻近基因座之间较高,并随距离的增加而减弱。这种模式通过D、标准化D-prime和相关系数r平方等度量进行总结。根据经验,人类基因组被组织成内部LD高、由重组热点分隔的单倍型区块,正如Reich等人(2001)所记录并由国际HapMap联盟(2005)系统绘制的。由于区块内的等位基因是相关的,少数标签SNP可以捕获大部分变异,这是全基因组关联研究有效扫描基因组的原理。
Clinical relevance
连锁不平衡是全基因组关联研究得以实现的基础:关联标记不一定是致病性的,它可能只是与真正的变异处于LD中,因此定位疾病变异需要在关联区域内进行精细定位。本条目描述了如何生成和解释此类证据,并作为参考背景,而非个体诊断或治疗的依据。
History
等位基因关联的概念早于分子标记,但其现代重要性随着密集的人类变异数据而增长。Reich等人(2001)表明,人类基因组中的LD延伸至相当长的距离并具有结构性,这项工作得到了国际HapMap联盟(2005)的巩固,该联盟构建了常见变异及其LD结构的全基因组图谱。Slatkin(2008)综合阐述了LD如何记录进化历史并实现医学定位,而Hirschhorn和Daly(2005)等综述则阐明了LD如何支撑复杂性状的全基因组关联研究。
Debates
- 基于LD的关联能否识别致病变异?
- 由于关联研究检测的是与真实变异处于LD中的标记而非变异本身,统计关联只能定位一个区域,但不能单独证明哪个变异是致病性的;需要进行精细定位和功能研究来解决这个问题。
- 群体结构如何混淆关联?
- 亚群之间等位基因频率的差异可能产生模拟与疾病LD的关联,因此需要考虑群体结构的方法来避免虚假发现。
Key figures
- Montgomery Slatkin
- David Reich
- Jonathan Pritchard
- Joel Hirschhorn
- Mark Daly
Related topics
Seminal works
- reich-2001
- hapmap-2005
- slatkin-2008
Frequently asked questions
- 连锁不平衡与遗传连锁有何不同?
- 连锁是指基因座在家族内跨越一代或几代的共同遗传,而连锁不平衡是群体水平上等位基因的关联,经过多代积累和消除;基因座可能连锁但LD很小,反之亦然。
- 为什么连锁不平衡会随距离衰减?
- 多代重组会打破等位基因之间的关联,由于远距离基因座之间发生交换的频率更高,因此两个基因座相距越远,LD通常越弱。