整合基因组学方法提升梅毒螺旋体系统发育与谱系分类研究

【字体: 时间:2025年10月04日 来源:Canadian Journal of Microbiology 1.6

编辑推荐:

  本研究针对梅毒螺旋体(Treponema pallidum)分类系统不完善的问题,通过分析827个基因组数据,建立了基于全基因组SNP的层级谱系框架,揭示了TPA谱系由单一外膜蛋白基因(group_313)决定,而TPE与TEN无显著遗传差异,为梅毒防控提供了重要的分子分型工具和理论基础。

  
在当今公共卫生领域,梅毒的重新流行已成为一个不容忽视的全球性健康挑战。自20世纪90年代末几乎被消灭以来,梅毒病例数持续上升,伴随着大环内酯类抗生素耐药性增加和先天性梅毒发生率的增长,这种 resurgence(再度流行)促使科研人员重新努力更好地理解和控制这一疾病。尤其值得注意的是,在加拿大,梅毒的发病率从20世纪90年代末的每10万人中不足0.5例急剧上升到2023年的每10万人30.5例,增长了61倍,这一数字令人震惊。
梅毒螺旋体(Treponema pallidum)是一个复杂的物种群,包含三个主要亚种:引起梅毒的TPA(T. pallidum subsp. pallidum)、引起雅司病的TPE(T. pallidum subsp. pertenue)和引起地方性梅毒(贝杰尔)的TEN(T. pallidum subsp. endemicum)。尽管这些疾病在临床和流行病学上存在明显差异——梅毒主要通过性接触传播,而雅司病和贝杰尔则通过非性行为的皮肤接触传播——但这些亚种之间却显示出惊人的基因组相似性,序列一致性超过99.8%。
长期以来,梅毒螺旋体研究面临着一个重大限制:无法在体外培养这种细菌。尽管最近开发的两种组织培养系统显示出了希望,但这种方法尚未广泛应用于梅毒螺旋体监测。因此,大多数研究仍然严重依赖基因组和生物信息学方法来进行TPA监测和检测与抗生素耐药性相关的遗传标记。此外,现有的分类系统主要关注TPA,排除了TPE和TEN菌株,限制了我们对梅毒螺旋体全谱多样性的理解。
为了解决这些研究空白,加拿大公共卫生局的研究团队开展了一项全面的基因组研究。他们分析了827个梅毒螺旋体基因组,创建了一个新的基于基因组的层级谱系框架,重新概括了主要的TPA谱系并描述了亚谱系特征。研究还构建了更新的泛基因组,揭示了重要发现。
研究人员采用了多种关键技术方法来完成这项研究。他们从NCBI获取了545个已组装的基因组,从SRA获取了283个新组装的基因组,经过严格的质量控制后,最终分析了784个TPA、34个TPE和9个TEN基因组(总计827个),这些样本采集时间跨度从1912年到2023年。研究使用核心SNP最大似然系统发育分析和PopPUNK(基于全基因组序列相似性的k-mer比较)进行谱系聚类,同时进行了泛基因组分析以验证谱系结构。他们还使用平均核苷酸一致性(ANI)分析确认了亚种间的相似性,并通过存在缺失变异(PAV)分析探索了辅助基因组变异。
基因组范围SNP改进梅毒螺旋体分化
研究发现,修剪后的ML核心SNP系统发育树反映了梅毒螺旋体基于核心基因组的进化历史。PopPUNK层级谱系重现了这些系统发育结果,为SS14、TEN和TPE各识别出一个谱系(分别为谱系1、4和5)。然而,Nichols被分成两个不同的谱系:一个包含大多数Nichols菌株(谱系2),另一个由37个来自马达加斯加的菌株组成(谱系3)。两种分析方法都证实,Nichols比SS14表现出更大的遗传多样性。
特别令人感兴趣的是Nichols-马达加斯加谱系,它来自一项测序了196个梅毒螺旋体基因组的研究,其中85个来自马达加斯加。这些马达加斯加样本采集于2000年至2007年之间,没有报告对阿奇霉素的耐药性增加。Nichols-马达加斯加谱系中的样本缺乏SNP变异,与SS14相似,并且与主要Nichols谱系相差约7个SNP。
辅助基因组可区分梅毒螺旋体亚种
梅毒螺旋体泛基因组由NCBI的544个基因组中识别出的1028个基因组成。其中960个是核心基因,每个基因组的基因中位数为964个(范围:893-968)。线性回归模型的EMMs揭示了SS14与Nichols和Nichols-马达加斯加谱系之间在基因计数上的显著差异,这是由单个基因的存在所驱动的。
Heap定律明确表明梅毒螺旋体具有开放基因组(γ = 0.016),表明新基因的持续增加。使用各个PopPUNK谱系创建的泛基因组显示,TEN的泛基因组增长最快(γ = 0.016),其次是TPE(γ = 0.015)、Nichols(γ = 0.010)和SS14(γ = 0.008)。
对梅毒螺旋体辅助基因组中PAV的PCoA分析进行了研究,以确定谱系之间是否存在组成差异,这可以为识别谱系特异性基因标记提供信息。分析揭示了两个不同的簇,对应于Nichols和SS14谱系,具有不重叠的95%置信区间。值得注意的是,Nichols-马达加斯加菌株完全包含在主要Nichols谱系簇内。
讨论
梅毒螺旋体新的层级谱系
PopPUNK谱系框架为诊断检测和流行病学追踪提供了超过当前TPA的MLST方案的关键优势。三个梅毒螺旋体亚种定义的29个亚谱系可用于指导接触者追踪和疫情调查。例如,我们能够使用来自马达加斯加的ML树识别两个先前描述的Nichols亚支(A和B)。此外,这些亚支中的一个,Nichols B,在PopPUNK模型中构成了Nichols-马达加斯加谱系的基础。
我们观察到TPA与TPE/TEN之间的核心基因组SNP距离显著更大,表明更深的进化分歧,这与最近梅毒螺旋体的phylodynamic(系统动力学)研究报道一致。这些结果得到了我们的泛基因组分析的支持,γ值存在显著差异,中位基因数量也存在差异,表明不同水平的基因组可塑性。总之,本研究中识别的核心SNP距离与报道的分歧时间一致。
辅助基因组代表更广泛的趋势
泛基因组分析强调了四个典型梅毒螺旋体谱系之间的基因组差异,并暗示了其遗传组成的显著变化。虽然这些发现与第一项泛基因组研究一致,但我们扩展的样本集允许更精细的分辨率,特别是在识别SS14和Nichols谱系基于group_313(一种推定的外膜蛋白)的存在而划分方面。SS14中这种额外的主要外鞘C末端结构域包含蛋白可能指示了早期的重组或复制事件。
梅毒螺旋体泛基因组的开放性质复制了先前研究的结果。开放泛基因组表明每个额外的基因组将贡献新基因,从而扩大总基因池。通常,开放基因组在经常经历高水平水平基因转移的同域细菌中观察到。相比之下,具有狭窄生态位的特化细菌,如梅毒螺旋体,通常预期具有封闭基因组。因此,观察到梅毒螺旋体具有开放基因组与正常预期相反。
Heap定律建模观察到的泛基因组增长率差异表明,TPE和TEN中增加的遗传多样性可能有助于梅毒螺旋体泛基因组的整体开放性。正如我们观察到的,TPE(77个基因)和TEN(104个基因)比Nichols(38个基因)和SS14(31个基因)具有更大的辅助基因组,暗示这些亚种中增加的基因组可塑性。
总之,这项研究提出了一个新的梅毒螺旋体层级谱系分类系统,得到了系统发育和泛基因组分析的支持。对梅毒螺旋体基因组结构的进一步研究,如SS14中group_313插入周围的基因组背景,以及毒力相关基因的PAV,将有助于完善我们对PopPUNK谱系的理解。总之,这些基因组见解和提出的方法具有推进公共卫生的巨大潜力,特别是在提高诊断精确度和指导梅毒控制的疫苗开发策略方面。持续的实验室监测 coupled with(结合)增强的基因组研究对于有效应对梅毒螺旋体带来的遗传多样性和不断演变的挑战至关重要。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号