什么是系统发育树(Phylogenetic tree)

AI解读 8小时前 硕雀
4 0

系统发育树Phylogenetic tree)概述


1. 什么是系统发育树

系统发育树是一种树状图,用来展示一组生物(或基因、病毒株等)之间的进化关系,假设它们都源自同一个共同祖先。树的分支模式反映了“谁从谁分化出来”,而分支长度则可以表示进化时间或遗传距离(视具体绘制方式而定)。


2. 树的基本构件

构件 含义
根(Root) 表示最早的共同祖先;有根树需要指定外群(outgroup)来确定方向
内部节点(Internal node) 代表假设的祖先或分歧事件,连接多个子分支
叶节点(Leaf / Terminal node) 树的末端,对应实际观测到的物种、基因或样本
分支(Branch / Edge) 连接节点的线段,常用来表示进化距离或时间

3. 系统发育树的主要类型

  1. 有根树 vs 无根树
    • 有根树:明确根节点,能够说明进化方向(谁是祖先,谁是后代)。需要外群来根化。
    • 无根树:只展示叶节点之间的相对关系,不涉及祖先‑后代的方向性。
  2. 二叉树 vs 多叉树
    • 二叉树:每个内部节点最多分出两个子分支,是最常见的形式。
    • 多叉树(多分支树):当数据不足以分辨更细的分支时会出现,表示不确定性。
  3. 克拉多格(Cladogram) vs 系统发育图(Phylogram)
    • 克拉多格:仅显示分支模式(拓扑),不考虑分支长度。
    • 系统发育图:分支长度与进化距离成比例,能够直观体现时间或遗传差异。

4. 构建系统发育树的常用方法

方法类别 代表算法 关键步骤
距离法(Distance‑based) UPGMA、邻接法(Neighbor‑Joining) 先计算序列或特征之间的距离矩阵,再依据距离聚类生成树
特征法(Character‑based) 最大简约法(Maximum Parsimony) 寻找解释观测特征变化最少的树形结构
概率法(Model‑based) 最大似然法(Maximum Likelihood)
贝叶斯推断(Bayesian Inference)
基于进化模型评估每棵树的似然度,选取最优或后验概率最高的树

构建流程一般包括:① 选取标记基因或形态特征 → ② 多序列比对 → ③ 选择合适的进化模型 → ④ 采用上述算法生成树 → ⑤ 用自助法(bootstrap)等手段评估树的可靠性。


5. 如何解读系统发育树

  • 最近共同祖先(MRCA)‍:两条分支最近的内部节点即为它们的最近共同祖先,节点越靠近根部,代表的祖先越古老。
  • 姐妹群(Sister groups)‍:共享同一最近共同祖先的两个分支称为姐妹群,说明它们的亲缘关系最密切。
  • 分支长度:若树为系统发育图,分支长度可近似表示进化时间或遗传变异量;若为克拉多格,则仅关注拓扑结构。
  • 支持值:常用 bootstrap 百分比或后验概率标注在内部节点上,数值越高说明该分支在重复抽样或模型下越稳固。

6. 系统发育树的主要应用

  1. 分类学与系统学:帮助重新划分物种、确认新种或阐明分类单元之间的演化关系。
  2. 进化生物学:揭示特征的起源与演化路径,如器官、行为或代谢途径的演化史。
  3. 流行病学:追踪病毒、细菌等病原体的传播源头和演化路线(如新冠病毒的谱系分析)。
  4. 保护生物学:评估濒危物种的遗传多样性,制定保护优先级。
  5. 比较基因组学:分析基因家族的扩张、收缩及功能演化。

7. 小结

系统发育树是生物学中用于可视化进化历史的核心工具。它通过根、内部节点、叶节点和分支的组合,展示了生物或基因之间的亲缘关系。根据是否根化、分支模式以及是否使用分支长度,可分为多种类型;而构建方法则从简单的距离聚类到复杂的概率模型不等。正确解读树的拓扑结构、分支长度和支持值,可为分类、进化、疾病追踪等多个领域提供重要线索。

来源:www.aiug.cn
声明:文章均为AI生成,请谨慎辨别信息的真伪和可靠性!