系统发育推断
系统发育推断是一套用于根据特征数据重建进化树的方法,它将相似性和差异性模式转化为关于祖先的假设。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
系统发育推断是根据可遗传特征(通常是分子序列)估计类群之间进化关系的过程。它生成一棵树,包含分支顺序和有时包含分支长度,该树在明确的最优性标准或概率模型下最能解释数据。
Scope
本主题涵盖了主要的建树方法,包括距离法、简约法、最大似然法和贝叶斯推断,它们所假设的序列进化模型,使用自举法和后验概率评估支持度,以及可能误导推断的陷阱,如长枝吸引现象。
Core questions
- 距离法、简约法、似然法和贝叶斯方法在推断进化树方面有何不同?
- 哪些模型描述了DNA序列沿分支如何变化?
- 如何评估对进化树的置信度,例如自举支持度或后验概率?
- 哪些伪影(如长枝吸引)可能导致不正确的进化树?
Key theories
- 基于最优性和基于模型的进化树推断
- 可以通过最小化特征变化(简约法)、拟合成对距离(距离法)或在明确的替换模型下最大化数据的概率(似然法和贝叶斯方法)来选择进化树。
- 自举法评估支持度
- 通过有放回地重采样特征并重建进化树,可以估计数据对每个分支群的支持强度,从而提供对推断关系置信度的标准衡量。
Mechanisms
距离法(如邻接法)将序列差异转换为矩阵,并通过聚类构建树,以牺牲部分信息为代价提供速度。简约法选择需要最少特征变化的树。最大似然法和贝叶斯方法采用明确的替换模型,考虑不等的碱基频率、转换-颠换偏好以及位点间速率变异,并寻找最能解释数据的树(和参数)。支持度通过最大似然法和简约法的自举法或贝叶斯分析中的后验概率进行评估。长枝吸引和模型错误指定可能会产生看似可靠但错误的树,因此方法选择和模型充分性至关重要。
Clinical relevance
系统发育推断重建病毒和细菌的传播历史,识别疫情源头,并确定耐药或高毒力菌株的出现时间,使其成为基因组流行病学的核心工具。
History
分支分类学和距离法在20世纪60年代至70年代出现;Saitou和Nei于1987年引入了邻接法,Felsenstein开创了序列的最大似然法,并于1985年将自举法应用于系统发育。此后,贝叶斯推断和日益庞大的基因组数据集已成为标准。
Debates
- 简约法与基于模型的方法之争
- 一个长期存在的方法学争论是,简约法还是明确的概率模型能提供更可靠的进化树,尤其是在进化速率不均匀和存在长枝吸引风险的情况下。
Key figures
- Joseph Felsenstein
- Masatoshi Nei
- Naruya Saitou
- Willi Hennig
Related topics
Seminal works
- saitouNei1987
- felsenstein1985
- felsensteinBook2004
Frequently asked questions
- 哪种方法能得到正确的进化树?
- 没有哪种方法能保证是正确的;基于模型的方法,如最大似然法和贝叶斯推断,通常更受序列数据青睐,但所有方法都可能被不均匀的进化速率和模型违背所误导,因此支持度测量至关重要。
- 自举值意味着什么?
- 自举值反映了当数据被重采样并重建进化树时,特定分组重复出现的频率;高值表明该分组得到了所分析特征的强烈支持。