两种高致病性原藻的高质量基因组破译:Prototheca bovis SH08 与 Prototheca ciferrii SH13 基因组图谱及其生物学意义

《Scientific Data》:Two high-quality genomes of Prototheca bovis strain SH08 and Prototheca ciferrii strain SH13

【字体: 时间:2025年12月03日 来源:Scientific Data 6.9

编辑推荐:

  本研究针对Prototheca bovis和Prototheca ciferrii这两种重要机会性致病藻类基因组信息缺乏的问题,利用PacBio HiFi长读长测序技术完成了两个高质量基因组组装。研究获得的P. bovis SH08和P. ciferrii SH13基因组大小分别为30.6 Mb和32.7 Mb,contig N50分别达到1.19 Mb和1.78 Mb,预测蛋白编码基因5,141和4,986个,功能注释覆盖率分别达97.28%和99.16%。这些基因组资源为原藻病的进化生物学、比较基因组学、致病性评估及诊断治疗策略提供了重要基础。

  
在微生物世界中,有一类特殊的无叶绿素微藻——原藻(Prototheca),它们虽然失去了光合作用能力,却演化成为能够感染人类和动物的机会性病原体。近年来,随着免疫抑制人群的增加和诊断技术的进步,原藻感染的报道呈上升趋势,已成为一个不容忽视的公共卫生问题。
原藻属微生物属于绿藻门(Chlorophyta)、共球藻纲(Trebouxiophyceae)、小球藻科(Chlorellaceae),广泛分布于全球各种环境中。目前已有18个原藻物种被报道,其中Prototheca wickerhamii是引起人类感染的主要病原体,而Prototheca bovis和Prototheca ciferrii则主要感染牛和犬类,可引起严重的乳腺炎和皮肤感染。
尽管原藻的临床意义日益凸显,但科学家们对其生物学特性和致病机制的认识仍相当有限。一个关键瓶颈是基因组资源的缺乏。虽然已有几个原藻基因组被测序,如P. wickerhamii ATTC16529和P. zopfii基因型2(Pz20和Pz23),但P. bovis和P. ciferrii的高质量基因组一直未被破译。这种基因组信息的缺失严重制约了原藻病的分子诊断、致病机制研究和防治策略开发。
为了解决这一问题,来自同济大学附属上海东方医院、华大基因和复旦大学附属华山医院的研究团队在《Scientific Data》上发表了题为“Two high-quality genomes of Prototheca bovis strain SH08 and Prototheca ciferrii strain SH13”的研究论文。该研究利用最新的PacBio HiFi长读长测序技术,成功组装了P. bovis SH08和P. ciferrii SH13两个菌株的高质量基因组,为原藻研究提供了宝贵的遗传资源。
研究人员采用多平台测序策略,首先从上海地区采集的奶牛乳汁(P. bovis SH08)和患者皮肤组织(P. ciferrii SH13)中分离菌株,经cytb基因鉴定确认物种。使用CTAB法提取高质量基因组DNA后,分别进行MGISEQ-2000短读长测序和PacBio SequelII HiFi长读长测序。P. bovis SH08获得5.5 Gb短读长数据和1.99 Gb HiFi数据,P. ciferrii SH13获得4.17 Gb HiFi数据。利用hifiasm软件进行基因组组装,并通过多种生物信息学方法进行重复序列注释、基因预测和功能注释。
基因组特征分析
研究结果显示,P. bovis SH08基因组大小为30.6 Mb,包含53个contig,contig N50为1.19 Mb,GC含量为73.6%。而P. ciferrii SH13基因组略大,为32.7 Mb,包含96个contig,contig N50达到1.78 Mb,GC含量为67.8%。两个基因组的最大contig长度均接近3 Mb,表明组装质量极高。
重复序列分析发现,P. bovis SH08和P. ciferrii SH13基因组中重复序列比例分别为14.79%和14.24%,其中以串联重复(Trf)为主,分别占基因组的8.83%和4.97%。
基因预测与功能注释
研究人员采用同源注释、从头预测和转录组数据整合的策略,预测出P. bovis SH08包含5,141个蛋白编码基因,P. ciferrii SH13包含4,986个蛋白编码基因。功能注释结果显示,两个基因组的功能注释覆盖率分别达到97.28%和99.16%。
KEGG通路分析表明,两个物种的基因主要富集在碳水化合物代谢、氨基酸代谢、脂质代谢等通路。其中P. bovis SH08有387个基因参与碳水化合物代谢,P. ciferrii SH13有365个基因参与该通路,表明碳水化合物代谢在原藻生物学中起重要作用。
基因组质量评估
通过Merqury评估基因组组装质量,P. bovis SH08和P. ciferrii SH13的QV值分别为56.4816和57.2924,对应准确率高达99.99977%和99.99981%。BUSCO完整性评估显示,基于chlorophyta_odb10数据库,两个基因集的完整度分别为76.7%和77.7%,与其他已公布的原藻基因组相当。
基因特征比较分析发现,P. bovis SH08和P. ciferrii SH13的基因长度、外显子长度、内含子长度等特征与P. zopfii Pz20和Pz23相似,反映了它们之间密切的进化关系。
基因组比较分析
研究人员将新组装的P. bovis SH08基因组与已发表的P. bovis SAG 2021基因组进行比较,发现两者具有高度相似性(>97%)。同样,P. ciferrii SH13与P. zopfii Pz20的基因组比较也显示高度保守(>96%),验证了组装准确性。
本研究成功获得了P. bovis SH08和P. ciferrii SH13的高质量基因组,填补了原藻属重要致病物种基因组资源的空白。这些基因组数据不仅为原藻的分类鉴定和进化研究提供了基础,也为深入解析其致病机制、开发新型诊断方法和治疗策略奠定了重要基础。
特别值得关注的是,研究团队还发起成立了原藻病科普与监测联盟(PSPMC)和中国原藻工作组(CPWG),旨在提高对原藻病的公众认知,改进其识别和诊断水平。随着这些高质量基因组资源的公开共享,预计将极大推动原藻研究领域的发展,为防控这种人畜共患病提供科学依据。
该研究的另一个重要意义在于展示了PacBio HiFi测序技术在微生物基因组研究中的强大能力。长读长测序技术能够有效解决复杂基因组区域的组装难题,获得更完整、更准确的基因组序列。随着测序成本的不断降低和技术的进一步成熟,高质量基因组测序将成为微生物学研究的标准方法,为理解微生物的生物学特性和致病机制提供更全面的视角。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号