金黄色葡萄球菌基因组数据库:全球克隆传播与耐药性进化机制解析

【字体: 时间:2025年09月27日 来源:BMC Genomic Data 2.5

编辑推荐:

  为解决临床重要病原体金黄色葡萄球菌(Staphylococcus aureus)的基因组监测难题,研究人员开发了包含98,950株分离株的综合数据库,提供MLST、SPA分型、cgMLST、AMR基因、毒力因子和质粒复制子等系统分析。该资源支持流行病学追踪和耐药机制研究,为开发新型防控策略提供关键数据支撑。

  
细菌感染已成为全球医疗卫生领域的重大挑战,随着抗菌素耐药性(AMR)问题日益严峻,特别是医疗相关感染的治疗选择越来越有限。世界卫生组织(WHO)已正式将AMR列为重大公共卫生问题。流行病学研究显示,AMR的传播往往由特定高风险细菌谱系介导,这些谱系常被称为"全球克隆"或"克隆复合体"。因此,监测这些流行克隆并阐明其致病机制和AMR获得途径已成为重要研究方向。
全基因组测序(WGS)技术的出现为这些研究带来了革命性变化,使得能够进行全面流行病学追踪和负责耐药基因转移的移动遗传元件的详细分析。然而,尽管可用细菌基因组序列数量呈指数增长,仍然存在重大挑战。当前基因组数据集往往存在临床相关菌株代表性不均和伴随元数据不一致的问题,这些限制为大规模比较研究和有效监测工作创造了障碍。
针对这一迫切需求,Andrey Shelenkov等研究人员在《BMC Genomic Data》发表了关于金黄色葡萄球菌这一具有全球临床意义的高优先级细菌病原体的综合基因组分析。该研究构建了包含98,950株金黄色葡萄球菌分离株的全面数据库,为研究人员提供了通过多个已建立的分型方案进行的详细分离株表征。
为了开展这项研究,研究人员从GenBank提取了99,191个金黄色葡萄球菌基因组序列,经过质量过滤后保留了98,950个分离株。研究采用了多种生物信息学分析技术:使用Institut Pasteur数据库进行MLST分型;通过MentaList软件基于1,861个位点生成核心基因组MLST(cgMLST)谱;利用Resfinder 4.6.0检测抗菌素耐药性基因;基于毒力因子数据库(VFDB)识别毒力因子;通过PlasmidFinder检测质粒复制子;使用CRISPRCasFinder分析CRISPR-Cas系统。所有分离株均来自NCBI基因组组装数据库,代表了全球范围内收集的临床和环境分离株。
基因组分型与克隆复合体分布
研究揭示了金黄色葡萄球菌基因组在公共数据库中的分布特征。82.3%的分离株属于13个已知克隆复合体(CC),其中四个最常见CC(CC8、CC5、CC22和CC1)占基因组的56.3%。CC8是最主要的克隆复合体,占20.6%(20,415株),其次是CC5(20.3%),CC22位居第三(8%)。这些发现与先前对44,012个基因组的研究一致,但ST数量已翻倍,表明种群多样性在增加。
SPA分型与CRISPR-Cas系统
研究还分析了蛋白A基因多态性X区域(spa)的分型结果,共发现4,393种SPA类型,其中最广泛传播的是t008(10%)、t002(8.5%)和NF(6.87%)。在CRISPR-Cas系统方面,仅有0.79%(784株)的分离株含有明显功能性III-A型系统,其中超过一半(413株)属于CC45。
抗菌素耐药性基因谱
AMR基因分析显示,每个分离株携带的AMR基因数量从1到23个不等,中位数为3。主要耐药基因包括blaZ(84%分离株携带)、mecA(61%)和ant(9)-Ia(20%)。值得注意的是,仅41个基因组检测到万古霉素耐药性van操纵子,这与临床分离株中约1%的检出率报告一致。
毒力因子与质粒特征
毒力基因数量从28到93个不等,中位数为77个。isd簇(编码铁获取蛋白)、cap簇(编码荚膜多糖合成酶)和sspC(编码细菌DNA保护蛋白)基因几乎在所有分离株中都存在。质粒分析显示87%(86,318株)分离株携带至少一个质粒复制子,每个分离株的复制子数量从0到16个,中位数为2。最丰富的质粒复制子是rep16(41%)、rep5a(27%)和rep7c(26%)。
该研究的结论部分强调,这一综合基因组数据库为金黄色葡萄球菌研究提供了三个主要支持:首先,支持对不同谱系中AMR基因流行率的统计评估和新相关性检测;其次,促进比较基因组学的参考基因组选择,克服了公共数据库在详细元数据方面的限制;第三,支持全球流行克隆监测和新克隆复合体的定义。数据库的定期更新计划将确保其持续相关性,为金黄色葡萄球菌的流行病学监测和抗菌素耐药性进化研究提供重要资源。
研究人员开发的这一资源采用Creative Commons Attribution-NonCommercial-ShareAlike(CC BY-NC-SA)4.0国际许可证提供学术使用,通过提供标准化、预先计算的基因组元数据,消除了从原始序列数据手动整理基因组特征的需要,特别适用于基因组流行病学这一新兴领域的研究人员。该数据库使研究人员能够快速识别特定研究目标的相关分离株集合,而质粒复制子数据为了解水平基因转移动态提供了重要见解,这些动态有助于AMR在这一临床相关病原体中的传播。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号