整合基因组学方法提升了梅毒螺旋体(Treponema pallidum)的系统发育研究及其谱系分类的准确性

《Canadian Journal of Microbiology》:Integrated genomic approaches improve Treponema pallidum phylogenetics and lineage classification

【字体: 时间:2025年10月03日 来源:Canadian Journal of Microbiology 1.6

编辑推荐:

  苍白螺旋体基因组分析构建了包含827个基因组的层级谱系框架和泛基因组模型,揭示pallidum亚种通过group_313基因区分SS14与Nichols谱系,而pertenue与endemicum亚种间无显著遗传差异。研究证实核心基因组SNP可支持分子流行病学监测,并发现accessory基因组差异与耐药性演化相关。

  近年来,梅毒的病例数量持续上升,这一趋势自20世纪末该疾病几乎被根除以来尤为显著。与此同时,大环内酯类抗生素耐药性的增加以及先天性梅毒的出现,也促使人们重新审视并努力控制这一疾病。本研究通过对827个梅毒螺旋体(*Treponema pallidum*)基因组的分析,创建了一种基于基因组的层级分类框架,不仅重现了主要的* T. pallidum *分支,还对子分支进行了详细描述。此外,我们构建了一个更新的泛基因组,揭示了* T. pallidum *亚种* pallidum *的分支主要由一个假定的主要外膜鞘C末端结构域基因决定,而* pertenue *和* endemicum *之间未观察到显著的遗传差异。这项研究引入了一种综合的基因组方法,用于刻画* T. pallidum *,并强调了泛基因组在支持公共卫生工作中的重要性。

梅毒螺旋体是导致梅毒、雅司病和贝杰尔病的病原体,这三种疾病在临床和流行病学上具有显著差异。梅毒主要通过性接触传播,而雅司病和贝杰尔病则通过非性接触的皮肤到皮肤传播。尽管这些疾病的传播途径和临床表现不同,但它们在基因组层面表现出极高的相似性,序列同源性超过99.8%。历史上,这些亚种曾被归类为不同的物种,基于临床和地理特征。然而,随着基因组学的发展,* T. pallidum *的三个亚种被确认为同一物种的复杂形式。现代分类工作主要集中在* T. pallidum * subsp. * pallidum *(TPA)上,因为其在流行病学和临床应用中的重要性。系统发育研究已经确定了TPA的两个主要分支——Nichols和SS14。为了支持流行病学监测,开发了一种基于多基因位点序列分型(MLST)的方案,但这种方法未能涵盖* pertenue *和* endemicum *的菌株,限制了其在全面理解* T. pallidum *多样性方面的应用。

由于* T. pallidum *无法在体外培养,大多数研究依赖于基因组和生物信息学方法来追踪其传播和检测抗生素耐药性相关的遗传标记。近年来,虽然体外培养技术有所进展,例如双组织培养系统,但这种方法尚未广泛应用于* T. pallidum *的监测中。因此,基因组分析仍然是研究该病原体的主要手段。这一限制也影响了我们对加拿大近年来梅毒病例激增的理解,该国的发病率从1990年代末的每10万人不到0.5例,上升到2023年的每10万人30.5例。相比之下,雅司病和贝杰尔病的发病率较低,主要局限于特定的地理区域,因此在基因组层面受到的关注较少。这种有限的基因组代表性限制了我们对* T. pallidum *亚种之间功能差异的理解。

为了解决这些研究空白,本研究引入了一种基于全基因组单核苷酸多态性(SNP)的层级分类框架,涵盖了所有三个* T. pallidum *亚种。我们比较了传统三基因位点MLST方案与新分类框架之间的系统发育关系,并通过更新的* T. pallidum *泛基因组验证了新框架的准确性。我们还进行了全面的基因存在缺失变异(PAV)分析,以探索辅助基因组的变异并识别潜在的分支特异性遗传标记。整体而言,本研究通过对所有公开可用的* T. pallidum *基因组数据(共827个,覆盖1912年至2023年)进行深入分析,结合强大的生物信息学方法,为理解* T. pallidum *亚种的遗传和进化关系提供了新的视角。

在数据收集和基因组组装方面,我们利用了来自NCBI的544个已组装基因组以及来自SRA的283个新组装基因组。通过使用fastp v0.24.0进行读取修剪,并利用Burrows-Wheeler Aligner–Maximal Exact Matches将人类读取过滤出去,确保了数据的纯净性。经过进一步处理,我们筛选出符合质量标准的基因组,排除了污染率高于1%、基因标记完成率低于90%或基因组长度不足1 Mbp或超过1.2 Mbp的样本。此外,我们还剔除了10个可能因基因组组装错误而影响结果的样本,最终纳入了283个新组装的基因组进行分析。这些基因组涵盖了784个TPA、34个TPE和9个TEN样本,分析时间跨度从1912年到2023年。

在系统发育分析和分支分类方面,我们首先对* tpr *基因家族以及* arp *和* tp0470 *基因进行了硬掩码处理,以减少高变异区域对系统发育推断的影响。这些基因的坐标通过BLASTN v2.12.0+从EMBL-EBI数据库中获取,并使用BEDtools v2.30.0确定掩码区间,平均掩码了29,898个位点。随后,我们使用fastANI v1.34进行了平均核苷酸同源性(ANI)分析,进一步验证了TPA、TPE和TEN之间的相似性。为了构建核心SNP最大似然(ML)系统发育树,我们采用了Snippy v4.6.0进行比对,并利用Gubbins v3.3.5进行重组掩码处理。最终的比对结果经过SNP-sites v2.5.1过滤,保留了只有标准核苷酸的对齐数据。使用IQ-TREE 2 v2.3.4重建了ML系统发育树,并通过1000次超快速自举复制(bootstrap replicates)提高了结果的稳健性。我们还选择了最佳的核苷酸替换模型,并计算了不同分支之间的SNP距离,构建了一个基于全基因组序列相似性的分支分类模型。

通过PopPUNK v2.7.2,我们对基因组进行了聚类分析,以识别分支和子分支。PopPUNK使用* k *-mer比较方法,将基因组分为不同层级的分支。在这一框架下,我们确定了SS14、TEN和TPE各有一个主要分支(Rank 5),而Nichols则被分为两个子分支:一个包含大部分Nichols菌株(Rank 2),另一个由37个来自马达加斯加的菌株组成(Rank 3)。这些子分支的识别基于显著的SNP差异和系统发育关系。我们还评估了PopPUNK分支和子分支的准确性,将其与传统的MLST方案进行了比较。结果显示,PopPUNK能够准确区分TPA的两个主要分支(Nichols和SS14),并且在分类更广泛的基因组时表现出色,因为约28.90%的基因组具有未见的MLST谱型。此外,PopPUNK还为TPE和TEN创建了子分支,揭示了这些亚种在基因组层面的清晰模式。例如,TEN被分为两个子分支,其中子分支20仅包含来自日本的基因组,而TPE的非人类灵长类菌株则形成了两个子分支,均源自坦桑尼亚。这些发现进一步支持了PopPUNK在分支分类中的应用潜力。

在辅助基因组分析中,我们构建了一个包含1028个基因的泛基因组,其中960个为核心基因。通过对辅助基因组的主成分分析(PCoA),我们发现Nichols和SS14在基因存在缺失模式上表现出显著差异,而TPE和TEN的辅助基因组则没有显著差异。这一结果表明,尽管TPE和TEN在SNP多样性上较高,但它们在辅助基因组层面的差异较小。进一步分析显示,TPE和TEN与TPA的主要区别在于缺少三个基因:* group_36 *、* group_313 *和* rpmD *。其中,* rpmD *与50S核糖体蛋白相关,而* group_36 *的功能尚不明确,但与JAG RNA结合蛋白有关。这些基因的缺失可能反映了TPE和TEN与TPA在进化过程中的分离。此外,我们发现TPE和TEN的基因组大小显著小于TPA,这可能与它们较低的基因组开放性有关。

通过Heaps’定律,我们进一步分析了* T. pallidum *泛基因组的开放性。结果显示,该病原体具有开放的泛基因组,意味着每个新的基因组都会带来新的基因,从而扩展整个基因池。这一发现与之前的研究结果一致,但本研究的样本量更大,提供了更精细的分辨率。值得注意的是,尽管TPE和TEN的辅助基因组表现出较高的开放性,但它们的PAV模式未能有效区分这两个亚种,这与之前报道的* tpr *基因家族中的特异性重复基序不同。相比之下,TPA的分支(Nichols、Nichols–Madagascar和SS14)表现出更稳定的泛基因组结构,这可能使它们在诊断和疫苗开发方面更具潜力。

本研究的发现对公共卫生具有重要意义。首先,PopPUNK的层级分类框架能够更准确地区分TPA的分支,同时也能涵盖TPE和TEN的菌株,从而为流行病学监测和疫情调查提供更全面的工具。其次,辅助基因组的分析揭示了TPA、TPE和TEN之间的遗传差异,特别是* group_313 *基因在SS14和Nichols分支中的存在与否,可能是区分这两个分支的关键。此外,泛基因组的开放性表明,* T. pallidum *具有一定的基因组可塑性,这可能与其适应不同宿主环境的能力有关。然而,由于TPE和TEN的基因组样本量相对较少,其泛基因组的开放性可能尚未完全反映其真实的遗传多样性。

未来的研究应进一步扩大TPE和TEN的基因组样本量,以更全面地理解这些亚种的遗传特征。此外,对* group_313 *基因的插入位置及其对辅助基因组聚类的影响进行更深入的分析,将有助于揭示其在进化过程中的作用。同时,对与致病性相关的基因进行PAV分析,将有助于更准确地识别不同分支的特征,从而为诊断和疫苗开发提供新的方向。随着基因组学技术的不断发展,结合实验室监测和基因组研究,将有助于更有效地应对* T. pallidum *带来的遗传多样性和流行病学挑战。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号