叶绿体珊瑚藻Amorphochlora amoebiformis核基因组揭示其高度富含内含子的独特结构及其在内共生基因转移中的演化意义
《DNA Research》:Nuclear genome sequencing reveals the highly intron-rich architecture of the chlorarachniophyte alga Amorphochlora amoebiformis
【字体:
大
中
小
】
时间:2025年11月29日
来源:DNA Research 2.9
编辑推荐:
本研究针对叶绿体珊瑚藻核基因组信息匮乏的问题,通过牛津纳米孔长读长测序技术完成了Amorphochlora amoebiformis的核基因组组装。研究发现其基因组大小(214 Mb)远超已知物种Bigelowiella natans(91.4 Mb),其中74%区域被剪接体内含子占据,为目前已知最富含内含子的真核基因组。同时,SNP分析揭示其双倍体特性,并检测到源自质体、线粒体和核仁体的DNA片段迁移证据。该研究为理解内共生事件后的基因组演化提供了关键模型,相关成果发表于《DNA Research》。
在真核生物的演化历程中,内共生事件扮演了至关重要的角色。一次古老的初级内共生,让一个异养原生生物吞噬了光合蓝细菌,从而诞生了最早拥有质体的藻类,并最终演化出包括绿藻、红藻等在内的原始色素体生物。而随后的多次次级内共生事件,则更为复杂:某些真核生物宿主又整合了已经具备质体的真核藻类(如绿藻或红藻),形成了具有复杂质体的藻类谱系。叶绿体珊瑚藻(Chlorarachniophytes)便是这一过程的杰出代表,它们是一类海洋单细胞藻类,其复杂质体起源于一种根足虫类原生生物(属于有孔虫界Rhizaria)与一种绿藻(与羽藻目Bryopsidales亲缘关系密切)的次级内共生。这次事件最引人注目的证据,便是内共生体细胞核的残留物——核仁体(nucleomorph),它像一个微小的“活化石”,存在于质体的膜间隙中,承载着一个高度简化的真核基因组。这使得叶绿体珊瑚藻在一个细胞内同时拥有四个遗传上独立的基因组:质体基因组、线粒体基因组、核基因组和核仁体基因组,成为研究内共生过程中基因组演化的绝佳模型。
尽管目前已有15种叶绿体珊瑚藻被描述,但对其核基因组的认知却长期局限于一个物种——Bigelowiella natans。其核基因组约为95 Mb,编码超过21,000个蛋白质基因,并以富含剪接体内含子(平均每个基因7.8个内含子)为特征。然而,这种单一物种的基因组信息难以揭示该类群整体的基因组多样性、演化规律以及内共生基因转移(Endosymbiotic Gene Transfer, EGT)的动态过程。例如,B. natans的基因组中仅检测到来自线粒体的DNA片段(NUMTs),而未发现来自质体(NUPTs)和核仁体(NUNMs)的转移痕迹,这背后的机制尚不清楚。另一方面,本研究的主角——Amorphochlora amoebiformis(原名Lotharella amoebiformis),是一种以变形虫形态为主的物种,拥有多个质体,与单质体、具鞭毛的B. natans在细胞形态上存在显著差异,并且是少数可实现瞬时遗传转化的叶绿体珊瑚藻实验模型。虽然其细胞器基因组已被测序,但此前基于短读长测序技术的核基因组组装高度碎片化(超过6万个支架,N50仅为8 kbp),严重阻碍了深入研究。为了填补叶绿体珊瑚藻核基因组信息的空白,并深入探究其基因组演化机制,研究人员对A. amoebiformis进行了高精度的核基因组测序与分析。
本研究主要采用了牛津纳米孔技术进行长读长测序,结合Illumina短读长数据进行校正,完成了高质量的核基因组组装。利用RNA-seq数据进行了基因表达谱和昼夜节律分析。通过单核苷酸多态性分析和k-mer频谱分析评估基因组倍性。运用BLAST比对和系统发育分析鉴定核基因组中的细胞器DNA片段及近期基因转移事件。并通过荧光蛋白标记和共聚焦显微镜观察验证了核编码细胞器蛋白的亚细胞定位。
研究人员通过纳米孔长读长测序技术,成功将A. amoebiformis(CCMP2058株系)的核基因组组装成567个重叠群,总长度约为214.2 Mb,N50达到693 kb。其基因组大小是B. natans(91.4 Mb)的两倍多,但预测的蛋白质编码基因数量(17,505个)却少于B. natans(21,708个)。造成这种巨大差异的核心原因在于A. amoebiformis基因组中存在着极其丰富的剪接体内含子。
与单倍体的B. natans不同,A. amoebiformis的核基因组显示出二倍体特征。通过将Illumina短读长数据比对到核基因组重叠群上,共检测到717,620个单核苷酸多态性位点,其等位基因频率呈现以50%为中心的峰形分布,强烈支持其为二倍体基因组。k-mer频谱分析也观察到了双峰分布,进一步佐证了这一结论。
基因表达分析显示,在12小时光照/12小时黑暗的循环条件下,A. amoebiformis的核基因表达呈现昼夜波动。高表达基因主要注释为光合作用相关蛋白和看家蛋白,其表达量在光暗周期中起伏,这与之前在B. natans中的报道一致。
对两个物种中保守的核糖体蛋白基因进行比较后发现,A. amoebiformis的核糖体蛋白基因中存在着26个B. natans中不存在的新增内含子。这些内含子具有典型的GT-AG边界 motif,且半数含有[AT]n简单序列重复。序列比对显示,其中9个内含子的插入位点对应于B. natans基因中的AG|GN motif,提示其可能通过类似于外显子-内含子边界的“原剪接位点”机制插入,以最小化对编码序列的破坏。此外,A. amoebiformis中35个剪接体蛋白的平均表达水平显著高于B. natans,这可能与其需要处理更多内含子的需求相适应。
A. amoebiformis中保守的鞭毛蛋白基因
尽管A. amoebiformis主要以变形虫形态存在,鞭毛细胞极为罕见,但其核基因组中仍保留了大部分核心的鞭毛内运输蛋白基因。然而,这些基因的表达水平普遍低于B. natans,暗示在其培养条件下,鞭毛相关基因的表达被抑制。
A. amoebiformis核基因组中的细胞器DNA片段
研究人员在A. amoebiformis的核基因组中鉴定出来自三个细胞器的DNA片段:4个核基因组整合的质体DNA片段(NUPTs,33-339 bp)、3个核基因组整合的核仁体DNA片段(NUNMs,60-83 bp)以及多个核基因组整合的线粒体DNA片段(NUMTs)。这与B. natans仅存在NUMTs的情况形成鲜明对比。由于A. amoebiformis拥有多个质体和核仁体,其DNA释放可能不至于致命,这支持了“有限转移窗口”假说,表明在A. amoebiformis中,从所有三个细胞器到核基因组的DNA迁移是持续进行的。
系统发育分析表明,A. amoebiformis核基因组中编码的NAD9(NADH脱氢酶亚基9)和RPS11(核糖体蛋白S11)蛋白,与其它叶绿体珊瑚藻线粒体编码的同源蛋白亲缘关系最近,强烈提示这两个基因是近期从线粒体转移到核基因组的。有趣的是,与典型的核编码线粒体蛋白不同,这两个蛋白的N端并未发现可被预测或识别的线粒体靶向导肽。荧光蛋白标记实验证实它们确实定位于线粒体,表明它们可能利用成熟蛋白序列中的某部分作为靶向信号,而非通过获得新的N端延伸。这种现象在近期发生基因转移的案例中并非孤例。
本研究通过对Amorphochlora amoebiformis核基因组的高质量解析,揭示了叶绿体珊瑚藻核基因组在大小、结构和倍性上存在巨大的种间差异。A. amoebiformis拥有目前已知最富含内含子的真核基因组,其内含子的获得可能与特定的DNA转座子活动有关。该物种为二倍体,这为其可能存在的有性生殖生活史提供了线索。最重要的是,研究发现了从所有三种细胞器(质体、核仁体、线粒体)向核基因组进行DNA迁移的证据,特别是鉴定出两个近期转移至核基因组且不依赖典型N端导肽即可成功靶向线粒体的基因(nad9和rps11),这为了解内共生基因转移的过程和机制提供了宝贵实例。这些发现极大地丰富了对复杂内共生事件后基因组演化动态的理解,凸显了叶绿体珊瑚藻作为研究真核生物进化与细胞器整合的独特模型价值。该研究成果发表于《DNA Research》期刊。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号