八角基因组--文献精读249

发布时间:2026/6/24 3:08:30

八角基因组--文献精读249 Early diversification and karyotype evolution of flowering plants被子植物的早期分化与核型演化摘要被子植物遍布全球维系着地球上所有生命活动。被子植物早期分化类群包括无油樟目、睡莲目、八角目以及由单子叶植物与其余四大类群共同组成的核心被子植物由于祖先多倍化事件推动其发生快速辐射分化上述类群间的演化关系长期存在巨大争议。本研究完成两种植物的高质量染色体水平基因组组装一是八角目代表物种八角基因组大小 12.5 Gb属大基因组物种二是作为现存所有单子叶植物姊妹类群的菖蒲。两套基因组补齐了被子植物各大主干类群代表性基因组的最后空白。基于共线性基因构建系统发育树证实无油樟目与睡莲目互为姊妹类群二者连同八角目、单子叶植物依次与其余核心被子植物类群构成姊妹演化关系。结合现存物种基因组间同源染色体共线性区块重建得出被子植物祖先核型染色体基数为 16。依托共有多倍化事件与祖先核型染色体融合特征本研究独立厘清所有取样物种的演化脉络该演化拓扑结构与共线性基因分析结果高度吻合其中尤为重要的发现是无油樟目与睡莲目共享一种其他被子植物均不具备的特有染色体融合事件。上述研究成果进一步深化了人们对被子植物早期分化历程与核型演化规律的认知为该领域研究提供了全新思路与理论依据。被子植物遍布全球现存物种超 35 万种。它们参与地球氧循环、水循环与碳循环维系陆地生态系统运转还为人类提供食物、建材、衣物、药材等几乎全部生存必需品。自达尔文时代起被子植物快速崛起与早期辐射分化的演化谜题便长期悬而未决学界对于被子植物祖先染色体基数的推算结果差异较大范围在x5~x9之间其中x7是认可度最高的推测值。依托现存被子植物开展的大量分子系统发育研究将其划分为四大主干类群由无油樟目、睡莲目、八角目共同组成的ANA 基部类群以及囊括绝大多数被子植物物种的核心被子植物。核心被子植物又细分为五大演化支单子叶植物、双子叶植物、木兰类植物、金粟兰目与金鱼藻目。但依托不同研究证据得出的各类群之间演化关系始终存在诸多争议与分歧。例如有研究认为仅无油樟目是其余所有被子植物的姊妹类群也有观点提出无油樟目与睡莲目共同构成被子植物基部姊妹类群而在核心被子植物内部单子叶植物究竟与双子叶植物、木兰类植物还是其余四大类群互为姊妹类群同样尚无统一结论。造成上述结论冲突的核心原因是被子植物早期受一次祖先全基因组加倍四倍化事件驱动发生了极速辐射分化类群祖先分化周期极短期间还普遍存在谱系分选不完全与物种杂交现象。此外各大类群在后续漫长演化历程中又各自独立发生全基因组加倍、全基因组三倍化等多倍化事件进一步扰乱了原本清晰的演化脉络。而染色体水平基因组序列可从两大维度有效厘清这些演化争议 第一筛选历经多倍化事件后序列完整、同源共线性关系保守的直系同源基因构建进化树这类基因比传统单拷贝基因、聚类同源基因更具优势 —— 传统同源基因易因多倍化后旁系同源基因随机保留、谱系分选不完全导致系统发育结果偏差 第二染色体融合这类发生频率低、演化上高度保守的大型基因组结构变异能够长期保留在现存物种基因组中可作为判定演化亲缘关系的可靠分子标记。近十年来绝大多数被子植物早期分化类群均已完成染色体水平基因组组装但仍存在两处关键空白八角目物种大多基因组体量庞大至今缺少高质量参考基因组作为所有现存单子叶植物姊妹类群的菖蒲目同样无染色体级别基因组发布。这两类关键代表物种的基因组缺失极大制约了学界对被子植物基部类群系统发育关系与核型演化规律的深入解析。两种关键被子植物染色体水平基因组组装本研究利用 PacBio HiFi 长读长测序结合 Hi-C 染色质互作技术成功组装得到八角目代表物种八角与单子叶植物最基部类群菖蒲科代表物种菖蒲的染色体水平基因组。八角组装基因组大小为 12.5 GbContig N50 达 10.68 Mb46.6% 的序列可锚定到 14 条假染色体上其基因组规模远大于其他被子植物基部类群物种研究证实近期重复序列大量扩增是八角基因组极度膨胀的主要原因。菖蒲组装基因组大小为 381 MbContig N50 为 35.6 Mb全部序列均可精准锚定至 12 条假染色体。两套基因组均具备极高的连续性、完整性与序列准确性。本研究分别在八角、菖蒲基因组中预测得到 47041 个、23942 个蛋白编码基因二者 BUSCO 评估完整性均高于 92.9%注释质量优异。多倍化事件与系统发育分析本研究选取 3 个 ANA 基部类群物种、5 个核心被子植物类群共计 17 种代表性植物开展后续分析包含 3 种 ANA 类群植物、7 种单子叶植物、2 种双子叶植物、3 种木兰类植物以及金鱼藻、金粟兰与 5 种外类群物种。多倍化是被子植物演化进程中的普遍事件且被子植物物种分化之前已发生一次古老的共同全基因组加倍事件。本研究通过基因共线性分析系统解析所有取样物种的多倍化演化历史结果证实八角与菖蒲均经历了物种特异性独立全基因组加倍事件。通过同义替换率Ks分布估算两次加倍事件发生时间八角 Ks 峰值 0.57、菖蒲 Ks 峰值 0.54校正演化速率后推算事件发生时间分别为距今 620~700 万年前、590~670 万年前与白垩纪 - 古近纪生物大灭绝时期高度吻合。除无油樟与泽泻外其余所有取样物种均检测到独立或共享的全基因组加倍、全基因组三倍化事件。以未发生额外多倍化的无油樟基因组为参照结合共线性关系划分各物种经多倍化分化形成的亚基因组筛选历经多倍化后依旧保留完整共线性关系的基因集用于系统发育构建。最终筛选出在 3 种 ANA 类群物种中均存在共线性且同时涵盖双子叶、单子叶、木兰类直系同源序列、匹配外类群同源序列的 1235 个保守共线性基因采用溯祖法构建物种进化树。系统发育结果明确证实无油樟目与睡莲目互为姊妹类群二者共同构成八角目与所有核心被子植物的基部姊妹演化支。基因树拓扑结构依旧存在明显冲突与以往基于单拷贝基因、聚类同源基因得出的结论一致ANA 三大基部类群演化分支极短直观印证了被子植物早期发生极速辐射分化。在核心被子植物内部溯祖分析支持单子叶植物与其余四大类群互为姊妹类群剩余四大类群又分为两大分支木兰类 金粟兰目、金鱼藻目 双子叶植物受辐射分化影响不同共线性基因构建的进化树拓扑结构仍存在分歧类群间演化分支同样偏短。在单子叶植物内部菖蒲、浮萍依次位于演化树最基部是其余所有单子叶植物的姊妹类群。基于共线性构建的进化树还能清晰还原各物种多倍化演化历程例如除菖蒲目、泽泻目外绝大多数单子叶植物共享 τ 全基因组加倍事件木兰目与樟目共享一次古老全基因组加倍事件。利用单拷贝基因数据集重复验证所得演化分支长度与拓扑冲突特征和前述结果一致再次佐证早期类群快速辐射分化的演化特征。被子植物祖先核型、染色体融合事件与演化关系动植物均可通过现存物种基因组重建祖先原始染色体与祖先核型染色体演化特征也是推断、验证系统发育关系的核心依据而高质量染色体水平基因组是精准重建祖先核型的前提。祖先多倍化事件发生后物种二倍化演化过程往往伴随大量染色体融合事件这类独特的基因组结构特征可在二倍体物种中长期保留。历经物种特异性多倍化后祖先原始染色体既可作为完整共线性区块整合融入现存物种融合染色体也能以独立染色体形式留存。植物染色体融合主要分为三种经典类型臂相互易位融合、端 - 端融合、嵌套染色体融合。本研究结合多个代表性物种保守同源完整区块与独立染色体特征重构被子植物祖先核型鉴定得到 16 条被子植物祖先原始染色体现存所有被子植物的染色体组成均是由这 16 条原始染色体经过反复染色体融合与片段断裂重组形成。本次重建得出的 16 条祖先染色体基数核型与以往研究结果存在差异主要原因是本研究新增多个关键类群高质量基因组数据同时优化了祖先核型重建分析方法。本研究依托三大判定依据厘清现存物种演化关系物种间共享的多倍化事件、源自祖先核型的共有染色体融合模式、由祖先核型演化而来的最短演化路径独立构建 17 个物种的演化关系图谱并标注各演化节点发生的染色体融合事件。该演化框架与共线性基因分析结果高度吻合尤其明确了 ANA 三大基部类群、单子叶植物与四大核心被子植物类群的层级演化关系。研究发现无油樟目中无油樟的 1 号染色体由两条祖先原始染色体经嵌套融合形成该融合事件及融合位点仅在睡莲目物种中共同存在印证无油樟目与睡莲目拥有共同祖先进一步支撑二者互为姊妹类群的演化结论该共同融合事件也让两类群祖先染色体基数由 16 缩减至 15。在八角目与核心被子植物分化之前祖先两条原始染色体发生端 - 端融合同样使染色体基数由 16 缩减为 15八角因后续发生物种特异性全基因组加倍该融合染色体再次分裂为两条。在核心被子植物共同祖先演化阶段又发生一次臂相互易位染色体融合除单子叶植物外其余核心被子植物均在相同位点发生该融合染色体片段断裂断裂后的片段还可与其他原始染色体再度融合重组。与之不同现存所有单子叶植物均完整保留两类古老融合染色体仅在后期分化物种中发生新一轮染色体融合即使历经物种特异性多倍化与染色体重排最基部的菖蒲依旧保留大量核心被子植物原始染色体特征。除去菖蒲目外其余单子叶植物共同祖先经历多次染色体融合将单倍体染色体基数由 14 缩减至 8浮萍分化出去后剩余单子叶植物祖先又先后经历 τ 四倍化、两次特有染色体融合事件形成稳定的祖先核型菠萝、水稻等物种分化前还发生六倍化事件这类染色体融合结构变异特征可作为精准判定香蕉、兰花等晚分化单子叶植物多倍化等级的基因组分子标记还可用于校正基因组组装错误。讨论本研究基于精准共线性基因包含类群特异性多倍化产生的全部旁系同源基因开展溯祖系统发育分析结果支持无油樟目与睡莲目互为姊妹类群二者再依次联合八角目、单子叶植物逐步与其余核心被子植物类群形成姊妹演化关系。该结论与以往多数依托单拷贝基因、聚类同源基因得出的 “无油樟目为所有其余被子植物基部姊妹类群” 的研究结果存在差异。与此同时对单条共线性基因逐一构建进化树发现在划分 ANA 基部三大类群以及五大核心被子植物类群时普遍存在进化树拓扑结构不一致、类群间演化分支极短的现象。由此可见针对经历快速辐射分化的植物类群依托共线性基因重建系统发育关系无法彻底排除统计误差与谱系分选不完全带来的干扰各类群间真实演化关系与分化模式仍需借助更多同源基因数据进一步验证。本研究发现无油樟目与睡莲目存在共有染色体融合事件为二者的姊妹类群亲缘关系提供了新的核型演化证据。染色体融合属于基因组宏观结构变异在动植物长期演化过程中既可能发生趋同演化也存在性状逆转的可能。但多项分析证实被子植物三大基部类群在极短时间内完成快速辐射分化大幅降低了此次共有嵌套染色体融合事件趋同演化的发生概率当然该可能性仍无法完全排除。此外该融合事件或许形成于二者与八角目分化之前属于祖先共有性状而非无油樟目与睡莲目特有的共衍征。若遵循这一演化情景则演化顺序为无油樟目最先分化随后睡莲目分化这与多数分子系统发育研究结论相符且二者共同保留该染色体融合特征但要解释八角目与核心被子植物后续出现的端 - 端染色体融合事件还需引入性状逆转等演化过程该简约性较差的演化推论与形态性状及部分序列变异构建的主流系统发育假说存在矛盾。同时祖先物种基因组宏观结构变异存在古老多态性也会导致利用此类核型性状构建进化树时出现谱系分选不完全问题。不过染色体融合通常会推动物种形成并产生生殖隔离能够有效降低上述干扰因素的影响。即便如此想要彻底排除 ANA 三大基部类群快速辐射分化过程中其他演化可能性仍需更多实验证据支撑。本研究重建得出被子植物祖先核型含有16 条原始染色体x16推测该核型由更为原始的单倍体基数 x8 经由祖先全基因组加倍演化形成。该染色体基数不同于以往学界推测的 x7但与被子植物三大基部现存类群的染色体数目高度契合经历祖先共同全基因组加倍后的二倍化过程中频繁发生染色体融合最终使无油樟目、睡莲目、八角目现存物种染色体基数均稳定为 x15。无油樟目与睡莲目共享这一罕见染色体融合特征证明二者直接起源于 x16 的祖先核型共同构成最先分化的被子植物基部演化支。染色体演化层面的证据进一步证实单子叶植物是其余四大核心被子植物类群的姊妹类群推翻了单子叶植物与双子叶植物、木兰类植物互为姊妹类群的过往观点。另外菖蒲基因组中保留了更多祖先原始染色体同源区块证实菖蒲科是最早从单子叶植物中分化出来的类群该结论也与同属近缘物种基因组研究结果相互印证。上述成果完善了被子植物与单子叶植物早期演化脉络也为后续通过重建祖先核型解析其他被子植物类群基因组与核型演化规律提供了新思路。本研究同时建议后续探究被子植物性状与基因演化历程时应将无油樟目与睡莲目共同作为最基部外类群开展分析。材料与方法多倍化分析与系统发育构建共线性分析借助 WGDI 软件-icl参数完成基因组内与基因组间共线性基因鉴定绘制共线性散点图统计物种间共线性占比判定物种多倍化倍性水平。利用 WGDI 整合 PAML 软件采用奈 - 乡碱基替换模型计算共线性基因间同义替换率Ks提取共线性区块中位 Ks 值完成 Ks 峰值拟合以此判定物种共有多倍化事件与物种特异性全基因组加倍、全基因组三倍化事件。依据基因组内部及物种间共线性深度比值、Ks 分布特征将共线性区块划分至不同亚基因组。例如某物种相较于外类群经历两次独立全基因组加倍则划分出 4 套亚基因组并依次命名结合近期多倍化事件调整亚基因组排布顺序保证拓扑结构符合((A1,A2),(A3,A4))演化规律统计染色体上各亚基因组分布区间再通过 WGDI-pc与-a参数筛选层级同源基因集。依托层级基因集结合 WGDI 整合 IQ-TREE 软件自动筛选最优碱基替换模型构建最大似然进化树利用 ASTRAL 软件统计单基因树中物种独立多倍化事件的支持率使用 ASTRAL-III v5.7.7 软件并设置线程参数-t 16构建溯祖物种树评估演化分支支持度。被子植物祖先原始染色体鉴定与祖先核型构建多倍化后的物种二倍化进程常伴随染色体融合祖先原始染色体可在融合染色体或独立染色体中完整留存。植物染色体融合主要分为三类染色体臂相互易位融合、端 - 端融合、嵌套染色体融合。若祖先原始染色体通过上述方式整合进融合染色体在现存基因组中仍视为完整祖先染色体原始染色体反复融合与断裂形成的多个同源区块也可在现存物种中被识别。端粒能够维持染色体结构完整组装完整的基因组染色体均含有端粒序列因此带有端粒的染色体序列优先判定为完整祖先染色体片段。被子植物祖先核型的全部原始染色体均可在基部被子植物现存基因组中找到同源序列并可跨多个代表性物种完成提取。使用 WGDI-d参数完成 17 个物种基因组序列比对绘制种内与种间同源共线性散点图以未发生额外多倍化的无油樟基因组为参照筛选带有端粒的染色体级同源区块含独立完整染色体。仅在至少 3 个物种中稳定存在的完整同源区块独立染色体或经三类融合方式形成的融合片段定义为祖先原始染色体并选取所有物种中结构最完整的同源序列作为该原始染色体的标准参考序列。若目标同源区块位于融合染色体一端则保留剩余序列并整合拼接为完整染色体若原始染色体断裂为多个同源片段剔除缺失序列后拼接剩余片段开启新一轮原始染色体筛选流程。重复筛选直至无新的同源结构域被检出最终鉴定得到 16 条祖先原始染色体共同组成被子植物祖先核型并以不同颜色对各类原始染色体进行标注区分。基于祖先核型的核型演化分析与演化关系构建运用 WGDI-km参数将 17 个现存物种基因组与被子植物祖先核型进行比对依托共线性片段明确各物种染色体由祖先原始染色体构成的组合方式统计原始染色体色块排布规律梳理所有染色体融合类型与演化模式。将拥有共同多倍化事件的物种划分为单系演化类群遵循系统发育分析通用的最短演化路径原则结合物种间共有染色体融合类型人工梳理 17 个物种的演化层级关系在演化祖先节点标注全部染色体融合事件。受部分关键类群高质量染色体水平基因组数据缺失限制少数物种间演化亲缘关系暂无法确定未做进一步界定。

相关新闻