等位基因频率谱和位点频率谱
等位基因(或位点)频率谱是样本中变异频率的分布:它统计有多少个变异位点含有一个拷贝、两个拷贝等,直至样本中的所有拷贝的等位基因。由于人口历史和自然选择都会在这种分布上留下独特的印记,因此该频率谱是群体遗传数据中最具信息量的总结之一。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
位点频率谱是样本中所有变异位点上衍生(或次要)等位基因计数的分布;等效地,它统计了样本中有多少位点具有每种可能的等位基因频率。
Scope
本条目涵盖了折叠和未折叠频率谱的定义、中性模型下的预期以及其作为人口学和选择推断目标的应用。这是一个方法学主题,不提供任何特定变异频率的临床解释。
Core questions
- 如何为序列样本定义频率谱?
- 在中性、恒定大小的群体中,频率谱是什么样的?
- 人口增长、瓶颈效应和选择如何扭曲频率谱?
- 频率谱如何用于拟合人口学模型?
Key concepts
- 折叠谱与未折叠谱
- 衍生等位基因和祖先等位基因
- 稀有变异过剩
- Tajima's D
- 人口学推断
- 人口增长对稀有变异的影响
Key theories
- 频率谱的合并预期
- 在标准中性合并模型下,具有i次衍生等位基因的位点预期数量与1/i成比例,从而导致稀有变异的特征性过剩;与此预期的偏差(由Tajima's D等统计量总结)用于检测人口变化或选择。
Mechanisms
每个分离位点都将其样本等位基因计数贡献给频率谱。在中性合并模型下,预期频率谱严重偏向稀有变异,而人口事件会可预测地重塑它:近期的人口增长会增加极稀有变异的数量,而瓶颈效应则会耗尽它们。选择也会局部改变频率谱。推断方法通过将观察到的频率谱与其预期相匹配来拟合人口学或选择模型,对大型样本进行深度测序已显示出大量稀有编码变异,这与近期快速的人口增长相符。
Clinical relevance
频率谱是临床基因组学中过滤变异时使用的等位基因频率阈值的基础,因为变异在参考人群中的稀有性是衡量其潜在重要性的一部分。本条目解释了群体水平的频率分布,并非个体诊断或治疗决策的依据。
Evidence & guidelines
频率谱的中性预期可追溯到合并理论和Tajima检验统计量,而人类外显子组的实证研究和人口学推断框架则表明了如何利用观察到的频率谱来重建人口历史并描述稀有变异的负担。
History
频率谱作为多态性数据的紧凑总结,起源于扩散理论和合并理论。随着基因组和外显子组测序技术的发展,它成为一个实用的推断目标。2010年代初期对大型人类样本的分析利用频率谱证明了近期爆炸性的人口增长以及由此导致的稀有变异过剩。
Key figures
- Fumio Tajima
- Simon Gravel
- Laurent Excoffier
- Carlos Bustamante
Related topics
Seminal works
- tajima-1989
- gravel-2011
- tennessen-2012
Frequently asked questions
- 折叠谱和未折叠谱有什么区别?
- 未折叠谱区分衍生等位基因和祖先等位基因,这需要知道哪个等位基因是祖先的;折叠谱在祖先状态未知时使用,它统计的是次要等位基因的计数。
- 为什么频率谱显示如此多的稀有变异?
- 即使在简单的中性模型下,稀有变异也预计会占主导地位,而近期的人口增长进一步放大了这一点,在大型样本中产生了大量极稀有变异的过剩。