混合与祖先推断方法
混合与祖先推断方法根据个体的基因型,估计其基因组中源自不同祖先来源群体的比例,并检验群体在过去是否发生过基因交流。它们将等位基因共享模式转化为关于祖先和群体混合的定量陈述。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
祖先推断是根据遗传数据估计个体基因组的祖先来源;混合推断则专门估计不同祖先群体贡献的比例,并检验它们之间历史上的基因流。
Scope
本条目涵盖基于模型的聚类和祖先比例估计、降维方法以及混合的正式检验,以及这些方法所依赖的假设。这是一个方法学主题;它描述了遗传祖先的统计推断,并未对祖先类别做出任何临床或社会主张。
Core questions
- 如何从基因型数据估计祖先比例?
- 基于模型的聚类和主成分方法有何不同?
- 如何正式检验群体间过去的基因流?
- 哪些假设和局限性会影响祖先估计?
Key concepts
- 祖先比例
- 基于模型的聚类 (STRUCTURE/ADMIXTURE)
- 来源群体数量 (K)
- 主成分分析
- f统计量和混合检验
- 祖先参考面板
Key theories
- 基于模型的祖先混合
- 每个个体的基因组被建模为来自K个具有不同等位基因频率的祖先群体的混合;基于似然或贝叶斯的方法共同估计祖先等位基因频率和每个个体的祖先比例,从而提供结构概率分解。
Mechanisms
基于模型的方法将每个基因组视为K个祖先群体的混合,并通过似然或贝叶斯推断估计祖先等位基因频率和每个个体的混合比例;高效的最大似然实现使得这在基因组尺度上成为可能。互补的方法使用主成分分析将个体置于低维祖先空间中,而无需预先指定群体。基于f统计量的正式混合检验通过比较群体间等位基因共享模式来检测和量化历史基因流。所有这些都依赖于适当的参考群体和对来源群体数量的选择。
Clinical relevance
祖先推断支持在遗传研究中正确处理群体结构,并在解释基因组结果时适当使用祖先匹配的参考数据。本条目描述了用于估计遗传祖先的统计方法,并非个体诊断或治疗决策的基础,也非将遗传祖先等同于社会身份的基础。
Evidence & guidelines
基于模型的祖先估计由STRUCTURE框架确立,并通过最大似然实现变得可扩展,而主成分方法和f统计量混合检验提供了互补的、广泛使用的方法;全球人类变异的全基因组调查展示了它们在不同群体中的应用。
History
多位点基因型基于模型的聚类于2000年左右引入,并迅速成为描述群体结构的标准;随着全基因组数据的增长,更快的最大似然实现随之出现。主成分方法在2000年代中期被应用于祖先推断,f统计量框架使古代混合的检验正式化,共同使祖先和混合推断成为群体基因组学的核心工具。
Debates
- 如何选择和解释来源群体数量 (K)?
- 基于模型的方法需要指定或选择K,但推断出的聚类是统计构造,其解释取决于采样和K;将其视为自然、离散的群体可能会产生误导。
Key figures
- Jonathan Pritchard
- John Novembre
- David Reich
- Nick Patterson
Related topics
Seminal works
- pritchard-2000
- alexander-2009
- patterson-2012
Frequently asked questions
- 例如,来自某个群体30%的祖先比例意味着什么?
- 这是一个基于模型的估计,大致表示该个体基因组的30%最能用该推断祖先来源的等位基因频率来解释;它是相对于所选参考群体的统计分解,而非固定的生物学标签。
- 如何检测群体间的混合?
- 基于f统计量的正式检验比较了几个群体间共享变异的模式;与没有基因流时预期情况的偏差提供了混合发生的证据。