树支持度与置信度
支持度量化了数据对估计树中各个分支的支持强度,从而可以区分系统发育中强和弱的部分。
用 PaperMind 寻找选题即将推出Find papers & topics
Tools & resources
Learn & explore
视频即将推出
Definition
树支持度是对系统发育树中给定分支或演化支(clade)置信度的定量估计,其来源于数据重采样或树的后验分布。
Scope
本主题涵盖了基于重采样的支持度,例如非参数自举法(bootstrap)和刀切法(jackknife),简约法下的衰减(Bremer)支持度,贝叶斯后验概率,以及这些度量的解释和已知偏差,包括特定支持度值的含义。
Core questions
- 重采样方法如何估计演化支的置信度?
- 自举值和贝叶斯后验概率之间有什么区别?
- 如何解释给定的支持度值?
- 哪些偏差会影响支持度量?
Key theories
- 非参数自举法
- 通过有放回地重采样性状来构建伪重复数据集,演化支在重复数据集中出现的频率被报告为其自举支持度。
- 自举值的解释
- 实证和模拟研究表明,在现实条件下,自举比例是对可靠性的保守估计,这为高值表示良好支持的演化支这一惯例提供了依据。
Clinical relevance
支持度值告诉研究人员哪些推断出的关系足够可靠,可以据此采取行动,这在系统发育指导疫情溯源、来源追踪或保护决策时,是一种重要的保障。
History
费尔森斯坦(Felsenstein)于1985年将自举法应用于系统发育,引入了一种实用且几乎普遍采用的置信度度量;随后的实证检验和贝叶斯后验概率的兴起,完善了系统学家报告和解释分支支持度的方式。
Debates
- 自举法与贝叶斯后验概率
- 对于相同的数据,贝叶斯后验概率通常高于自举值,关于哪种方法校准得更好以及如何解释每种方法,目前仍在持续讨论中。
Key figures
- Joseph Felsenstein
- David Hillis
- James Bull
Related topics
Seminal works
- felsenstein1985
- hillis1993
- felsenstein2004
Frequently asked questions
- 95%的自举值意味着什么?
- 这意味着该演化支在95%的重采样伪重复分析中出现;高值表明结果对性状的重采样具有鲁棒性,尽管它们并非精确的统计概率。
- 为什么贝叶斯后验概率与自举值不同?
- 它们的计算方式不同,后验概率反映了包含某个演化支的采样树的比例;对于相同的数据,它们通常高于相应的自举支持度。