基于微生物组数据的疾病预测:贝叶斯成分广义线性混合模型的创新突破

《BMC Bioinformatics》:Bayesian compositional generalized linear mixed models for disease prediction using microbiome data

【字体: 时间:2025年04月06日 来源:BMC Bioinformatics 2.9

编辑推荐:

  为解决微生物组数据预测疾病时,传统方法忽略小效应影响预测性能的问题,研究人员开展了贝叶斯成分广义线性混合模型(BCGLMM)用于疾病预测的研究。结果显示,该模型在模拟和真实数据中预测准确性更高,有助于提升疾病诊断和治疗水平。

  在生命科学和健康医学领域,微生物组数据对于理解和预测疾病易感性至关重要。微生物组数据通常以成分数据的形式呈现,即各微生物物种的相对丰度。然而,传统的预测建模方法在处理这类数据时面临诸多挑战。一方面,成分数据的固定和约束特性,使得其在广义线性模型中无法直接应用,因为它不满足满秩条件,方差矩阵总是奇异的 。另一方面,现有方法大多基于高维稀疏假设,认为只有少数微生物组特征与疾病结局相关,而在实际情况中,大效应和小效应常常同时存在,忽视小效应会显著降低模型的预测性能。
为了突破这些困境,来自美国福克斯蔡斯癌症中心(Fox Chase Cancer Center)、肯尼索州立大学(Kennesaw State University)、阿拉巴马大学伯明翰分校(University of Alabama at Birmingham)等机构的研究人员展开了深入研究。他们提出了贝叶斯成分广义线性混合模型(Bayesian Compositional Generalized Linear Mixed Models,BCGLMM),相关研究成果发表在《BMC Bioinformatics》上。

研究人员在研究过程中运用了多种关键技术方法。在模型构建方面,基于标准广义线性混合模型,引入随机效应项和结构化正则马蹄形先验(structured regularized horseshoe prior),同时利用软和为零约束(soft sum - to - zero restriction)处理成分数据的固定和约束问题。为评估模型性能,采用了留一法交叉验证(leave - one - out cross - validation)技术,并借助 R 软件和 brms 包进行模型拟合和分析。数据方面,使用了模拟数据以及美国肠道项目(American Gut Project)的公开数据。

研究结果主要通过模拟研究和真实数据应用两部分呈现。

  • 模拟研究:模拟生成不同维度(m = 100, 300, 500)的微生物组相对丰度数据矩阵,设定不同数量的中等效应和小效应组合,分别生成连续和二元结局数据。对比 BCGLMM、仅考虑预测变量相关性的 BCGLM 以及忽略随机效应和预测变量相关性的 BGLM 三种模型。结果表明,当 m 在 100 - 300 时,三种方法收敛性良好;当 m = 500 时,调整局部参数和全局参数的先验分布解决了 NUTS 采样器的发散问题。对于连续结局,随着小效应比例增加和维度增大,BCGLMM 优势愈发明显,R2值更高,偏差更低;对于二元结局,BCGLMM 在多数情况下也优于其他两种方法。
  • 真实数据应用:利用美国肠道项目中 4684 个粪便样本和 1002 个物种数据,以炎症性肠病(Inflammatory Bowel Disease,IBD)为预测目标。通过近似贝叶斯留一法交叉验证评估模型性能,以受试者工作特征曲线下面积(AUC)为指标。结果显示,BCGLMM 的 AUC 值为 0.702,高于 BCGLM 的 0.687 和 BGLM 的 0.672,证明其在预测 IBD 方面具有更强的能力。

研究结论和讨论部分指出,BCGLMM 有效解决了成分微生物组数据在疾病预测中的关键问题,包括成分结构、高维度和系统发育关系等。该模型能够同时考虑少量个体显著遗传效应和众多小遗传因素的集体影响,平衡两者关系,提高了疾病预测的准确性。这是首次在微生物组数据疾病预测中系统解决这些问题,为相关研究开辟了新路径。尽管 BCGLMM 存在计算负担大的问题,但它为微生物组研究提供了强大且灵活的工具,在复杂数据结构分析中具有重要价值,有望推动疾病诊断和治疗领域的发展。

下载安捷伦电子书《通过细胞代谢揭示新的药物靶点》探索如何通过代谢分析促进您的药物发现研究

10x Genomics新品Visium HD 开启单细胞分辨率的全转录组空间分析!

欢迎下载Twist《不断变化的CRISPR筛选格局》电子书

单细胞测序入门大讲堂 - 深入了解从第一个单细胞实验设计到数据质控与可视化解析

下载《细胞内蛋白质互作分析方法电子书》

相关新闻
生物通微信公众号
微信
新浪微博

今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

版权所有 生物通

Copyright© eBiotrade.com, All Rights Reserved

联系信箱:

粤ICP备09063491号