
-
生物通官微
陪你抓住生命科技
跳动的脉搏
结核分枝杆菌PE/PPE基因家族的持续进化:耐药性与宿主免疫应答的关联机制
【字体: 大 中 小 】 时间:2025年09月23日 来源:mSystems 4.6
编辑推荐:
本文通过分析51,229个结核分枝杆菌基因组,首次系统揭示了PE/PPE基因家族(占基因组10%)在耐药性进化与免疫逃逸中的关键作用。研究发现该基因家族呈现放松的纯化选择特征,鉴定出12个正选择基因和7个耐药相关基因,其中PPE51的功能缺失突变与多药耐药性(MDR)显著相关。研究还发现6个PE/PPE基因的T细胞表位存在多样化选择,为疫苗开发提供新靶点。该研究通过基因组掩蔽技术突破了短读长测序对高GC含量区域的限制,为结核病(TB)防治策略提供了重要理论依据。
结核分枝杆菌(Mycobacterium tuberculosis, Mtb)中的脯氨酸-谷氨酸/脯氨酸-脯氨酸-谷氨酸(PE/PPE)基因家族约占其基因组的10%,以其高GC含量和高度重复的序列特征而闻名。这些特性使得传统短读长测序技术难以准确解析该基因家族,导致其序列多样性和进化动力学研究长期滞后。近期发展的基因组掩蔽技术表明,约54%的PE/PPE序列可从短读长数据中恢复,为在群体水平研究该基因家族的进化提供了契机。本研究通过对51,229个Mtb基因组的分析,系统揭示了PE/PPE基因家族的序列多样性和选择压力。结果显示,与其他基因类别相比,PE/PPE基因承受着更为宽松的纯化选择,具体表现为更高的非同义突变与同义突变比率(pN/pS)和更大的突变负荷。研究鉴定出12个呈现正选择信号的PE/PPE基因,其中7个与抗生素耐药性相关。特别值得注意的是,PPE51基因显示出有利于功能缺失突变的正选择,且这些突变仅出现在已具有多药耐药性(MDR)的菌株中。这一模式暗示了补偿性进化或与二线/新引入药物耐药性相关的适应性进化。此外,研究在6个PE/PPE基因中发现了承受多样化选择的T细胞表位,表明免疫驱动适应机制的存在。本研究为PE/PPE基因的遗传多样性提供了基线特征,并重点指出了可能参与宿主免疫和抗生素压力适应的特定基因,为后续研究指明了方向。
结核病仍是全球重大健康挑战,部分原因在于结核分枝杆菌对抗生素和人体免疫应答的卓越进化适应能力。其基因组中约10%由PE/PPE基因构成,但由于其重复序列和高GC含量,这些基因的功能和进化动力学至今未被充分理解。本研究采用先进的基因组掩蔽方法分析了51,229个全球Mtb基因组,揭示了众多处于正选择下的PE/PPE基因,这些基因可能促进抗生素耐药性和免疫逃逸。尤为重要的是,PPE51在多药耐药菌株中经常发生功能缺失,暗示其在药物治疗期间对细菌生存具有重要作用。此外,研究还识别出6个PE/PPE基因中的易突变区域,为未来疫苗开发提供了潜在靶点。我们的发现强调了PE/PPE基因在Mtb进化与耐药性中的关键作用,为开发新型治疗和疫苗策略提供了宝贵见解。
结核分枝杆菌基因组中约10%编码PE/PPE家族基因,共包含168个基因(69个PPE和99个PE基因)。PE和PPE基因以其保守的N端序列为特征,分别形成PE(Proline–Glutamate)和PPE(Proline–Proline–Glutamate)结构域,在Mtb基因组中构成独特的基因类别。自从与其最近共同祖先分化以来,Mtb已失去水平基因转移能力,且PE/PPE基因数量在Mtb复合体不同成员间保持稳定。
Mtb PE/PPE基因大家族被赋予多种多样功能。近期研究表明某些PPE和PE蛋白(如PPE51和PE19)可能形成孔蛋白样复合物,参与营养获取。此外,PE/PPE蛋白可调控感染期间的宿主免疫应答和细胞死亡。例如,PE-PGRS11和PE-PGRS17能与宿主TLR2受体相互作用诱导树突细胞成熟,从而增强CD4+ T细胞增殖和细胞因子分泌。类似地,PPE57可通过TLR2激活巨噬细胞,促进Th1免疫应答并增加干扰素-γ和白介素-2的产生。由于许多PE/PPE蛋白表面暴露、分泌且高度保守,它们也成为结核病疫苗开发的关键焦点。候选疫苗M72/AS01E包含融合蛋白M72(结合PPE18与非PE/PPE蛋白Rv0125),而候选疫苗ID93以PPE42作为核心免疫原组分。
PE/PPE基因家族与抗生素作用机制相关的生物学过程或细胞成分存在关联,表明Mtb可能进化这些基因以应对抗生素压力。例如,PPE54的遗传变异与利福平、异烟肼和乙胺丁醇耐药相关;PE_PGRS7的突变与链霉素耐药相关;PE11通过改变分枝杆菌细胞壁脂质组成增强疏水性、降低抗生素渗透性,从而增加抗生素耐药性。
全球Mtb群体中PE/PPE基因的序列进化至今缺乏充分记载,主要因其高GC含量(可达80%)、广泛序列相似性和重复序列使基于短读长测序数据的准确分析变得复杂。因此,这些基因通常被排除在短读长基因组测序分析之外,严重限制了我们对其序列变异的理解。然而,Marin等人最近提出了使用长读长测序作为基准的基因组掩蔽方案,能够从短读长数据中可靠分析约54%的PE/PPE序列。这项技术使得利用现有Mtb全基因组短读长序列研究PE/PPE基因的多样性和进化成为可能。本研究通过该掩蔽方案获得的高质量测序数据,聚焦54%的高质量PE/PPE基因区域,表征了51,229个Mtb分离株中PE/PPE基因家族的序列变异和适应性进化。我们发现PE/PPE基因家族主要承受纯化选择,但一个子集显示出适应性进化特征。在这个子集中,部分基因与抗生素耐药性相关,而其他基因则似乎由宿主免疫选择驱动。
通过应用过滤标准,从51,229个菌株中筛选出49,954个Mtb分离株纳入本研究。使用Marin等人提出的基因组掩蔽方案,发现31.5%(53/168)的PE/PPE基因被高质量序列区域完全覆盖,另有19.6%(33/168)的基因长度覆盖度超过80%。高质量区域的覆盖在不同基因类别间存在差异,PE_PGRS基因代表性尤其不足:仅46.8%(29/62)的PE_PGRS基因覆盖度高于50%,而PE基因和PPE基因的相应比例分别为94.5%(35/37)和75.4%(52/69)。此外,高质量区域在PE/PPE结构域和C端的分布存在显著差异,PE/PPE结构域的覆盖比例显著高于C端区域。
所有PE/PPE基因的高质量序列总长度为151,798 bp,占其基因组总长度(281,073 bp)的54%。在这些区域中,我们识别出40,193个独特突变,平均每100 bp有26.5个SNP。
为识别PE/PPE基因中的突变事件,我们采用系统发育重建推断突变轨迹,并将影响同一系统发育支系菌株的所有突变合并为单个突变事件。为减少计算负荷,将49,954个分离株根据先前亚系定义方案分为25组,利用系统发育邻近性平衡不同组的样本数量。随后使用IQ-TREE2中的最大似然法为每组重建系统发育树,并根据每棵树中的突变轨迹重建识别突变事件。总共在168个PE/PPE基因中识别出53,843个突变事件。
PE/PPE基因在慢生长分枝杆菌中经历扩张,可能是对这些分枝杆菌孔蛋白丢失的补偿机制。我们推测这些近期扩张基因的选择压力可能与基因组其他部分不同。使用pN/pS和突变负荷作为选择压力的代理指标,分析了116个基因长度覆盖度至少50%的PE/PPE基因。pN/pS计算了非同义(NS)与同义(SY)突变的比率,并经中性模拟预期值标准化,值大于1表明正选择。突变负荷计算了基因长度调整后的标准化突变事件。
PE/PPE基因的突变负荷显著高于必需和非必需基因类别。与既往研究一致,Mtb基因组中必需基因的pN/pS值显著低于非必需基因(0.69 vs. 0.84)。然而,我们发现PE/PPE家族基因的pN/pS值显著高于基因组其他部分的必需和非必需基因(0.90 vs 0.69和0.84)。接着按照Cole等人定义的功能类别对Mtb基因进行分类,发现PE/PPE组的pN/pS值和突变负荷显著高于其他类别。这些结果表明,与Mtb基因组中的必需、非必需及其他功能类别基因相比,PE/PPE基因表现出显著更高水平的序列变异。
PE/PPE基因增加的序列多样性表明其中部分基因可能经历了适应性进化。我们随后在基因长度覆盖度>80%的基因中寻找正选择信号,共发现12个pN/pS值提示正选择的基因。例如,PE36的pN/pS值为1.67(NS:SY = 105:28),影响598个分离株;lipX的pN/pS为1.43(NS:SY = 84:23),影响584个分离株。有趣的是,在lipX密码子78、88和92处观察到提前终止突变,每个突变独立发生三次。相反,六个PE/PPE基因具有极低的pN/pS值,表明纯化选择保持这些基因保守。例如,PPE40的pN/pS值为0.42(NS:SY = 165:167)。
我们推测高pN/pS值提示的选择压力应与突变负荷正相关,因为经历适应性进化的基因不仅应显示更高的非同义突变比率,还应呈现更多标准化非同义突变事件。线性回归显示pN/pS值与非同义突变负荷间存在显著正相关(R2 = 0.11),而仅使用同义突变评估时发现与pN/pS负相关(R2 = 0.1)。pN/pS与非同义突变负荷的正相关符合特定基因的适应性进化,而与同义突变负荷的负相关表明这些模式不能仅归因于内在突变率。
至今已有17个基因被验证与Mtb表型耐药相关,但无一属于PE/PPE基因家族。我们推断若任何PE/PPE基因参与耐药进化,其突变将在耐药分离株中富集。为寻找可能与耐药相关的PE/PPE基因,我们比较了每个基因在耐药和敏感菌株中的pN/pS比率,鉴定出七个在耐药组中pN/pS比率显著更高的基因。其中PPE51特别引人关注,其pN/pS值从敏感菌株的0.8升至耐药菌株的2.08。此外,PPE51突变体在耐药菌株中显著富集(OR: 1.92)。这些PPE51突变在密码子210-250间呈现热点,蛋白质结构建模预测该区域形成α螺旋-环结构,表明这些突变具有功能意义。其中三个突变为提前终止密码子,可能导致PPE51功能缺失。
我们还分析了敏感和耐药菌株中PPE51的插入缺失突变,发现indel在耐药菌株中显著富集(OR: 5.08),其中89.6%引起移码,进一步表明耐药菌株中PPE51功能缺失的趋势。
由于Mtb以逐步方式进化多药耐药性,我们采用逐步方法推断PPE51突变被选择的阶段。按耐药药物数量对分离株分组发现,在药物敏感或耐2-4种药物的分离株中,PPE51的pN/pS比率仍低于1,表明纯化选择;而在耐6种及以上药物的样本中,pN/pS比率升至1.5,提示正选择。类似趋势在未固定突变分析中也被观察到。PPE51的NS突变在2.2.1谱系耐药菌株亚支中独立发生23次,所有这些突变都是在获得katG和rpoB突变(分别 confer 异烟肼和利福平耐药,共同构成MDR-TB)后获得的。菌株成为MDR-TB后出现PPE51功能缺失,暗示补偿性进化或由二线/新近引入药物选择。
Mtb抗原识别是宿主免疫应答的关键组成部分,也是Mtb抗原表位进化的主要驱动因素。对PE/PPE基因家族外表位的研究表明大多数表位高度保守,但极少研究检验PE/PPE基因家族内的表位。当我们比较PE/PPE基因内表位与其他基因组区域表位时,pN/pS值无显著差异。然而与既往研究相反,PE/PPE和非PE/PPE表位的pN/pS比率均高于必需基因。为验证此发现,我们计算了配对dN/dS值(评估NS与SY比率并考虑NS突变等位基因频率),确认PE/PPE和非PE/PPE表位的dN/dS比率均高于必需基因,并发现PE/PPE表位的dN/dS显著高于非PE/PPE表位,表明PE/PPE表位可能承受放松的纯化选择。
高pN/pS比率的表位见于PPE23(3.83)和PPE43(4.33),但最高的是PE12(pN/pS=6.27,NS:SY=14:1),包含五个位点具有两次以上趋同突变事件。Q133H突变在谱系6和牛分枝杆菌祖先以及谱系4.9祖先中独立出现,分别有960和18个分离株携带此突变。然而在PE/PPE基因家族内,表位的pN/pS与非表位区域无显著差异。
认为PE/PPE基因家族起源于ESX-3基因座内的祖先PE5-PPE4基因对,随后通过复制事件扩张。基于PE/PPE结构域序列的系统发育分析,PE/PPE基因可分为II组(PPW家族)、III组、IV组(SVP家族)和V组(MPTR家族),这些分组与PE/PPE基因进化起源顺序吻合。例如,IV组(SVP家族)被认为起源于所有慢生长分枝杆菌的共同祖先,而V组(MPTR家族)起源于系统发育相关慢生长分枝杆菌(戈登分枝杆菌、Mtb和堪萨斯分枝杆菌)的共同祖先。因此,这些组群的起源时间顺序从早到晚为:II(PPW)、III、IV(SVP)、V(MPTR)。我们假设最近进化的PE/PPE基因可能仍处于适应性选择下,因而可能表现出与较早进化基因不同的选择压力。但比较这些组中PE/PPE基因的pN/pS值后未发现选择压力存在显著差异。这表明即使最新出现的PE/PPE基因也已作为群体在基因组中定位,并在Mtb菌株中趋于保守。
除基于进化起源分析外,我们还从功能重要性角度研究自然选择。鉴于ESX分泌系统的关键生物学功能,我们假设ESX基因座内的PE和PPE蛋白将更保守。PE和PPE蛋白对(如PE25-PPE41和PE5-PPE4)形成异源二聚体分泌至细菌外,编码这些二聚体的基因在基因组中通常相邻。据此,我们将PE和PPE基因分为三组:位于五个ESX基因座内的基因;成对出现的基因;以及作为单基因出现的基因。比较这些组间的pN/pS比率发现,ESX基因座内的PPE基因pN/pS比率显著低于其他两组,且NS突变负荷较低(虽无统计学差异)。在PE基因中未观察到类似趋势。
PE和PPE结构域形成螺旋-转角-螺旋发夹结构,通常组装成异源二聚体,空间上对齐WxG和YxxxD/E基序形成被VII型分泌系统识别的复合结构。因此,PE和PPE结构域及其相关基序预期高度保守。我们分析这些结构域和基序的多样性及自然选择,意外发现PE和PPE结构域与其各自C端间的pN/pS比率无显著差异。PPE结构域和PPE C端的平均pN/pS分别为0.88和0.89;PE结构域和PE C端的平均pN/pS分别为0.88和0.94。鉴于PE/PPE结构域与C端区域间高质量覆盖度的显著差异,我们将116个基因按总覆盖度分为两组:低覆盖组(50%-80%高质量区域)和高覆盖组(>80%高质量区域)。在每组内比较PE/PPE结构域与C端的pN/pS值,均未发现显著差异。尽管所有PPE基因一起考虑时结构域与C端无显著差异,但某些PPE基因在PPE结构域呈现比C端更高的pN/pS比率。例如在PE_PGRS34(高质量区域比例:0.79)中,PE结构域的pN/pS比率为1.38,而PGRS结构域为0.82。
本研究利用约50,000个Mtb分离株的WGS数据,调查了PE/PPE基因家族响应宿主免疫和抗生素压力的适应性进化。分析在序列结构域、PE/PPE亚家族和Mtb谱系等多个层面进行。我们发现PE/PPE基因家族比其他基因类别呈现更高的突变多样性和pN/pS比率,表明放松的纯化选择。然而,12个基因以及多个涉及营养摄取、金属离子转运和脂肪酶活性的基因表位处于正选择下。与抗生素耐药性相关的七个基因包括PPE51——一种近期表征的转运蛋白,可能补偿Mtb中孔蛋白的进化丢失。此外,我们鉴定出13个高度保守的PE/PPE基因(pN/pS < 0.7)作为未来疫苗开发的潜在候选靶点。
由于PE/PPE基因家族内的重复和高度相似序列,使用短读长测序分析这些基因组区域特别困难。因此,大多数Mtb基因组研究排除PE/PPE基因,严重限制了对该基因家族序列多样性和进化特征的理解。虽然一些近期研究使用第三代长读长测序研究PE/PPE基因,但该技术的高成本限制了其广泛应用,尤其涉及数千Mtb分离株的群体研究。幸运的是,近期基因组掩蔽方案表明许多PE/PPE基因可通过短读长测序数据可靠分析,使得重新分析公开短读长测序数据并探索PE/PPE基因进化特征成为可能。通过采用该基因掩蔽方案,我们能够分析~50,000个Mtb基因组中~54%的PE/PPE基因区域,首次获得该基因家族遗传多样性的群体规模视图。
我们鉴定出七个可能与耐药相关的PE/PPE基因。这些耐药相关基因似乎富集于涉及外膜金属离子转运和营养摄取的蛋白质,如PPE51、PE15和PE20。PPE51-PE19对被认为作为孔蛋白样复合物功能,参与甘油、葡萄糖和磷酸盐摄取。尽管其他几个PE/PPE对与外膜营养转运相关,但它们对耐药的贡献尚不明确。Wang等人发现删除Mtb中PPE51 confer 对小分子化合物的耐药性,推测通过阻断生长抑制化合物的摄取。这里我们发现PPE51处于正选择下,但仅发生在细菌获得katG和rpoB突变成为多药耐药之后。我们发现PPE51中43/48的突变为移码indel或提前终止突变,表明选择压力有利于PPE51功能缺失。许多这些菌株在获得PPE51突变前还积累了其他耐药基因(如gyrA、rrs甚至mmpR5)的突变。PPE51非同义突变的富集在耐6-8种抗TB药物菌株中最显著,表明PPE51突变出现在耐药进化极晚期阶段。这提出可能性:PPE51缺失可能参与对近期引入药物(如贝达喹啉或利奈唑胺)的耐药性,这些药物常在出现一、二线药物耐药后处方。我们检查了105个WHO目录数据集中的BDQ耐药菌株,发现仅两个携带PPE51突变,限制了评估统计显著性的能力。或者,PPE51突变可能通过恢复MDR/XDR菌株适应度贡献晚期耐药进化。对MDR背景中选择性突变基因的功能研究需要操作MDR-TB菌株,这在许多BSL-3实验室被禁止。因此,来自临床分离株的更广泛群体水平数据对 deciphering PPE51在Mtb耐药进化中的作用至关重要。
我们的结果暗示选择突变压力正作用于涉及营养和金属离子转运的PE/PPE基因,以重塑Mtb与宿主的代谢界面。例如,PE15(ESX-3分泌系统底物)与PPE20形成功能复合物,涉及Ca2?转运;PPE31可能参与Mg2?摄取。类似地,PPE36和PPE37(血红素铁获取必需)在耐药分离株中显示升高的pN/pS值,表明耐药进化期间持续适应铁可用性。金属转运与耐药间的关联可能源于共享调控通路或交叉耐药机制。在其他细菌(如大肠杆菌和金黄色葡萄球菌)中,金属离子应激诱导外排泵过表达,这些泵也能排出抗生素。Mtb中可能存在类似机制,其中锌转运蛋白Rv3270和镍/钴转运蛋白Rv2856与增强药物外排相关。总之,这些发现表明抗生素暴露可能驱动Mtb不仅通过经典耐药途径适应,还通过改变涉及营养和金属获取的基本系统以在 hostile 环境中维持稳态和适应度。
我们的分析还发现多个PE/PPE来源T细胞表位中多样化选择证据,修正了长期认为Mtb表位进化超保守的观点。值得注意的是,PE12和PPE23等基因中的表位显示升高pN/pS和dN/dS比率,多个趋同非同义突变在不同Mtb谱系中独立出现。这表明一些PE/PPE抗原可能进化以逃避宿主T细胞识别,这对TB疫苗设计可能具有重要潜在意义。许多亚单位疫苗候选(包括ID93和M72/AS01E)纳入PE/PPE蛋白,因其免疫原性和细菌外表定位。然而,我们观察到的表位变异引发关于抗原在循环Mtb菌株群体中稳定性的问题。评估这种表位变异性是否会降低遗传多样化群体中的疫苗效力或促进疫苗推出后的免疫逃逸将十分重要。
基于PE/PPE基因家族已建立的系统发育分组(如MPTR、SVP、PPW),我们假设近期复制基因将呈现更高pN/pS比率,反映持续适应。然而,我们的分析揭示这些亚组间选择压力无显著差异,表明大多数PE/PPE基因无论进化年龄如何,均已经历功能稳定化。此观察暗示PE/PPE基因不仅是遗传漂变或随机扩张产物,而且可能获得物种特异性生物学角色,现于纯化选择下维持。这强化了新兴观点:许多PE/PPE蛋白参与与宿主相互作用、营养获取或免疫调节相关的专门化且
生物通微信公众号
知名企业招聘