利用BV-LDER-GE整合加性遗传效应与连锁不平衡信息挖掘基因-环境互作机制

【字体: 时间:2025年10月04日 来源:Genome Biology 9.4

编辑推荐:

  为解决基因-环境互作(G×E)检测效力不足的问题,研究人员开发了双变量连锁不平衡特征值回归方法(BV-LDER-GE),通过联合建模G×E互作比例(hI2)与G×E遗传协方差(ρIG)并利用全连锁不平衡(LD)信息,显著提升了基因组尺度G×E互作检测效力。在UK Biobank数据中鉴定出63个显著信号,证实了G×E互作在复杂性状中的广泛存在,为精准医学提供了新工具。

  
在遗传流行病学领域,基因与环境因素如何共同影响复杂性状一直是核心科学问题。尽管全基因组关联研究(GWAS)已成功鉴定大量与疾病相关的遗传变异,但环境因素如何调节遗传风险仍缺乏系统研究手段。传统方法存在明显局限:一方面,基于单个位点的全基因组互作扫描(GWIS)统计效力不足;另一方面,现有汇总统计方法未能充分利用连锁不平衡(LD)信息且忽略加性遗传效应与互作效应的协同作用。这导致大量真实的G×E互作信号被遗漏,阻碍了对疾病机制的深入理解。
为突破这一瓶颈,来自耶鲁大学和德克萨斯大学阿灵顿分校的研究团队在《Genome Biology》发表了创新性研究方法BV-LDER-GE(BiVariate Linkage-Disequilibrium Eigenvalue Regression for Gene-Environment interactions)。该方法通过联合建模G×E互作比例和G×E遗传协方差,并整合全LD信息,实现了对基因组尺度G×E互作的高效检测。研究团队利用英国生物银行(UK Biobank)30万欧洲裔样本数据,系统分析了151种环境-表型组合,发现G×E互作在人类复杂性状中广泛存在,为精准预测疾病风险提供了新范式。
研究主要采用以下关键技术:1)基于随机效应模型的双变量联合建模框架,同步估计hI2和ρIG参数;2)全LD信息利用技术,通过对LD矩阵进行特征分解(eigen-decomposition)实现Z值向量变换,提升估计效率;3)删除分块刀切法(delete-block-wise jackknife)计算经验方差-协方差矩阵;4)针对可遗传环境变量的混淆效应校正技术;5)基于UK Biobank大规模基因型-表型数据的验证体系。

Model overview

研究人员建立了同时包含加性效应和互作效应的随机效应模型:标准化表型Yi由加性遗传效应βj、G×E互作效应γj及残差项共同构成。其中hg2为狭义遗传力,hI2为G×E互作比例,ρIG=√(hg2hI2)rIG表示G×E遗传协方差。该模型首次将两类参数纳入统一框架。

Joint modeling of G×E interaction proportion and G×E genetic covariance

通过联合检验hI2和ρIG的马氏距离(Mahalanobis distance),显著提升检测效力。模拟研究显示:当rIG较低时,单独检验hI2效力最高;而当hg2、hI2和rIG均较高时,检验ρIG更具优势。联合建模在参数不平衡场景(hI2较小但hg2和rIG较大)表现最优。

Utilize full LD information to estimate G×E genetic covariance more accurately

通过特征分解LD矩阵R=UDUT,构建变换后Z值向量Z?G=D(-1/2)UTZG,推导出更精确的矩估计条件。模拟显示:BV-LDER-GE估计值的经验标准差比PIGEON平均降低23.7%,相当于样本量增加53%。在UK Biobank实数据中,BV-LDER-GE检测到50个显著G×E遗传协方差信号,而PIGEON仅检测到40个。

Correct the confounding effects introduced by heritable environmental variable

针对可遗传环境变量(如BMI、饮酒量)带来的混淆效应,通过推导交叉变量乘积矩条件,迭代估计hE2、ρIE等参数。BV-LDER-GE对G×E互作比例的估计效率比PIGEON提高22.2%,对G×E遗传协方差的估计效率提高24.7%。在151对E-Y分析中,发现30对存在由环境变量遗传成分引起的混淆效应。
研究结论表明,BV-LDER-GE通过双路径提升检测效力:一是联合建模利用加性遗传效应的部分信息(其效应量通常大于G×E互作效应);二是全LD信息的使用提升参数估计质量。该方法在控制I类错误的同时,显著增强了对G×E互作的检测能力。UK Biobank实数据验证显示,联合建模检测鉴定出63个显著信号,远超单独检验hI2(35个)或ρIG(50个)的效果。
讨论部分指出,联合建模的局限性在于仅输出p值而无法提供参数估计值;且该方法基于多基因性假设,当效应分布偏离高斯假设时可能降低估计效率。尽管如此,BV-LDER-GE仍为G×E研究提供了优先靶标筛选的强大工具,其发现的多重环境暴露与遗传风险的交互作用(如T2D与性别、吸烟、年龄等多因素互作)为机制研究指明了新方向。
该研究的创新性在于首次实现G×E遗传协方差与互作比例的联合推断,突破传统方法仅利用部分LD信息的局限,为大样本生物银行数据的G×E互作分析建立了新标准。未来工作可扩展至罕见变异处理、非高斯效应分布建模等挑战,进一步推动复杂性状基因-环境互作机制的解析进程。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号