Lineage-specific microbial protein prediction enables large-scale exploration of protein ecology within the human gut:肠道微生物蛋白研究的新突破
《Nature Communications》:Lineage-specific microbial protein prediction enables large-scale exploration of protein ecology within the human gut
编辑推荐:
在微生物组分析中,基因预测存在诸多问题,限制了对微生物生态系统的理解。研究人员开展了基于谱系的基因预测研究,开发了相关工具,扩大了人类肠道蛋白质库,揭示了蛋白质与宿主健康的关联,为研究微生物与宿主相互作用提供了新视角。
在人体肠道这个神秘的 “小宇宙” 里,生活着数以万亿计的微生物,它们与人体健康息息相关。然而,目前微生物组分析在研究这些微生物时遇到了不少难题。以往研究多聚焦于微生物的分类群,可真正让人感兴趣的是它们的功能。而且,微生物使用多种遗传密码和基因结构,在宏基因组分析中却常被忽视,这就导致了错误的蛋白质预测,使得很多蛋白质功能无法确定,极大地限制了我们对微生物生态系统的理解。再加上现有的基因注释工具在面对不同分类群时表现不稳定,对真核生物基因预测效果差,还缺乏全面的训练数据集,这些都成了研究路上的 “绊脚石”。
为了攻克这些难题,来自德国 RWTH 大学医院(RWTH University Hospital)的研究人员挺身而出,开展了一项极具创新性的研究。他们致力于开发一种谱系特异性基因预测方法,并将其应用于人体肠道微生物研究。最终,研究成果发表在了《Nature Communications》上。
研究人员在研究过程中,用到了几个关键的技术方法。首先,他们测试了 13 种基因预测工具,并根据分类学分配和参数定制,选择了效果最佳的工具组合。接着,对 9634 个宏基因组和 3594 个基因组进行分析,这些样本来自多个研究项目和不同国家人群。之后,利用 Kraken 2 和 GTDB-Tk 进行分类学分配,还开发了 InvestiGUT 工具用于蛋白质生态学研究。
下面来看看具体的研究结果:
- 谱系特异性基因预测扩大了人类肠道蛋白质库:研究人员开发了一种基于分类学的基因预测流程,针对不同分类群选择合适的基因预测工具并优化参数。用这个方法分析大量宏基因组和基因组后发现,预测出的基因数量比单一工具更多,新增了 108,744,169 个基因(14.7%),由此构建了 MiProGut 蛋白质目录,使人类肠道蛋白质景观增加了 210.2%。
- 增强了对人类肠道蛋白质景观的覆盖:通过与已有的统一人类胃肠道蛋白质(UHGP)目录对比,发现 MiProGut 涵盖了更多功能,包括非细菌领域的功能。对 862 个宏转录组样本分析表明,MiProGut 能检测到更多蛋白质表达,覆盖的转录组 reads 比 UHGP 多 22.9 ± 9.9% 。而且还发现了许多水平基因转移的证据,这在肠道微生物群落的进化中起着重要作用。
- 鉴定出人类肠道中常见表达的小蛋白簇:许多基因预测工具默认会忽略小蛋白,研究人员调整参数后预测出大量小蛋白(5.2% of total proteins),并发现其中 69 个小蛋白簇(SPCs)在 90% 以上的样本中高度表达。部分 SPCs 具有潜在的抗菌活性,可能对肠道生态系统很重要。
- 蛋白质在个体间的生态分布揭示了与宿主健康状况的关联:研究人员开发了 InvestiGUT 工具,利用它研究蛋白质与宿主参数的关系。以甲基辅酶 M 还原酶(MCR)为例,发现其与宿主年龄、BMI、性别、抗生素使用以及国家地区都有关系。此外,还发现一些小蛋白与炎症性肠病(IBD)等疾病有关。
研究结论和讨论部分意义重大。这项研究整合分类学信息进行基因预测,发现了大量之前被忽视的蛋白质,为研究肠道微生物功能提供了更全面的视角。不过,研究也存在一些局限性,比如分类学分配仍有困难,很多蛋白质缺乏功能注释,样本存在地域和年龄偏倚等。但总体来说,该研究提出的蛋白质生态学概念为后续研究指明了方向,InvestiGUT 工具也为深入研究蛋白质与宿主健康关系提供了有力支持,有望推动微生物与宿主相互作用的研究,为相关疾病的诊断、治疗和预防开辟新道路。
婵炴垶鎸搁鍫澝归崶鈹惧亾閻熼偊妲圭€规挸瀛╃€靛ジ鏁傞悙顒佹瘎闁诲孩绋掗崝鎺楀礉閻旂厧违濠电姴娲犻崑鎾愁潩瀹曞洨鐣虹紓鍌欑濡粓宕曢鍛浄闁挎繂鐗撳Ο瀣煙濞茶骞橀柕鍥ㄥ哺瀵剟骞嶉鐣屾殸闂佽偐鐡旈崹铏櫠閸ф顥堥柛鎾茬娴狀垶鏌曢崱妤婂剱閻㈩垱澹嗗Σ鎰板閻欌偓濞层倕霉閿濆棙绀嬮柍褜鍓氭穱铏规崲閸愨晝顩烽柨婵嗙墦濡鏌涢幒鎴烆棡闁诲氦濮ょ粚閬嶅礃椤撶姷顔掗梺璇″枔閸斿骸鈻撻幋锔藉殥妞ゆ牗绮岄埛鏍煕濞嗘劕鐏╂鐐叉喘閹秹寮崒妤佹櫃
10x Genomics闂佸搫鍊瑰姗€骞栭—娓媠ium HD 閻庢鍠掗崑鎾绘煕濮樼厧鐏犵€规洜鍠撶槐鎺楀幢濮橆剙濮冮梺鍛婂笒濡粍銇旈幖浣瑰仢闁搞儮鏅滈悾閬嶆煕韫囧濮€婵炴潙妫滈妵鎰板即閻樼數鐓佺紓浣告湰濡炶棄螞閸ф绀嗛柛鈩冡缚閳ь兛绮欓弫宥夋晸閿燂拷
濠电偛妫庨崹鑲╂崲鐎n偆鈻旈悗锝庡幗缁佺櫉wist闂侀潧妫楅敃锝囩箔婢舵劕妫樻い鎾跺仜缂嶄線鏌涢弽銊у⒈婵炲牊鍘ISPR缂備焦绋掗惄顖炲焵椤掆偓椤︿即鎮ч崫銉ゆ勃闁逞屽墴婵″鈧綆鍓氶弳鈺呮倵濞戞瑥濮冮柛鏃撴嫹
闂佸憡顨嗗ú婊呭垝韫囨稒鍤勯柣鎰嚟閵堟挳骞栭弶鎴犵闁告瑥妫濆濠氬Ω閵夛絼娴烽柣鐘辩劍瑜板啴鎮ラ敓锟� - 濠电儑绲藉畷顒勫矗閸℃ḿ顩查柛鈩冾嚧閹烘挾顩烽幖杈剧秵閸庢垵鈽夐幘顖氫壕婵炴垶鎼╂禍婊冪暦閻旇櫣纾奸柛鈩冭壘閸旀帡鎮楅崷顓炰槐闁绘稒鐟ч幏瀣箲閹伴潧鎮侀梺鍛婂笧婢ф寮抽悢鐓庣妞ゆ柨鐏濈粣娑㈡煙鐠ㄥ鍊婚悷銏ゆ煕濞嗘ê鐏ユい顐㈩儔瀹曠娀寮介顐e浮瀵悂鏁撻敓锟�
婵炴垶鎸搁鍫澝归崶顒€违濠电姴瀚惌搴ㄦ煠瀹曞洤浠滈柛鐐存尦閹藉倻鈧綆鍓氶銈夋偣閹扳晛濡虹紒銊у閹峰懎饪伴崘銊р偓濠氭煛鐎n偄濮堥柡宀€鍠庨埢鏃堝即閻樿櫕姣勯柣搴㈢⊕閸旀帡宕濋悢鐓幬ラ柨鐕傛嫹