跨祖先群体HLA聚焦型1糖尿病遗传风险预测模型的构建与验证

【字体: 时间:2025年10月04日 来源:Diabetologia 10.2

编辑推荐:

  为解决T1D遗传风险评分(GRS)在欧洲以外人群适用性不足的问题,研究人员开展跨祖先HLA聚焦型GRS研究。发现基于SNP的T1D GRSHLA与等位基因模型性能相当,跨祖先组合模型T1D GRSHLA-ALL在所有群体中均表现优异(AUC 0.82-0.88),为多族裔T1D筛查提供标准化工具。

  
在糖尿病研究领域,1型糖尿病(Type 1 diabetes, T1D)作为一种由胰腺β细胞自身免疫破坏导致的慢性疾病,其遗传机制研究长期存在明显的族群偏倚。尽管已知人类白细胞抗原(Human Leukocyte Antigen, HLA)区域贡献了T1D约50%的遗传风险,但绝大多数遗传风险评分(Genetic Risk Score, GRS)模型都基于欧洲裔人群数据构建,这在全球范围内推广应用时面临重大挑战。随着流行病学研究发现非欧洲裔人群T1D患病率呈现上升趋势,开发适用于多祖先群体的精准风险预测工具成为当务之急。
这项发表在《Diabetologia》的研究由弗吉尼亚大学基因组科学系主导,联合布莱根妇女医院和密歇根大学多个团队,通过对41,689例样本的大规模分析,首次系统性地构建并验证了面向多祖先群体的HLA聚焦型T1D遗传风险评分模型。研究团队创造性地比较了基于SNP和HLA等位基因的两种建模策略,并评估了祖先特异性模型与跨祖先组合模型的预测性能,为T1D的全球性筛查提供了重要方法论基础。
研究采用了几项关键技术方法:首先利用T1DGC和SEARCH研究队列的41,689例样本(16,198例T1D患者和25,491例对照),通过ImmunoChip芯片对HLA区域13,695个SNP进行基因分型;采用HLA-TAPAS多族裔参考面板进行HLA等位基因插补;使用PLINK进行主成分分析(PCA)和逻辑回归分析;通过条件分析筛选独立性遗传变异;最后利用ROC曲线和DeLong检验评估模型性能并比较差异。
研究结果方面,通过条件分析发现不同祖先群体存在显著差异:非洲混血群体(AFR)鉴定出5个SNP和6个HLA等位基因,美洲混血群体(AMR)发现3个SNP和5个等位基因,欧洲群体(EUR)发现38个SNP和40个等位基因,芬兰群体(FIN)发现6个SNP和8个等位基因。跨祖先组合分析(ALL)最终纳入36个SNP和41个HLA等位基因。
在模型性能评估中,基于SNP的T1D GRSHLA模型ROC AUC范围0.74-0.88,基于等位基因的模型为0.73-0.88。特别值得注意的是,跨祖先组合模型T1D GRSHLA-SNP-ALL和T1D GRSHLA-allele-ALL在所有群体中表现一致优异,AUC值分别介于0.82-0.88和0.80-0.87之间,且与最佳祖先特异性模型无显著差异。
在模型转移性验证中,跨祖先组合模型在AMR群体中的表现显著优于AMR特异性模型(AUCALL=0.82 vs AUCAMR=0.78, p=7.86×10-6),在EUR群体中也优于EUR特异性模型(AUCALL=0.88 vs AUCEUR=0.87, p=4.73×10-6),证明跨祖先模型具有更好的泛化能力。
补充分析显示,加入非HLA区域SNP可将预测性能进一步提升(AFR群体AUC从0.86升至0.88),但在独立验证队列中,仅使用23个HLA区域SNP即可达到0.806的AUC,加入67个非HLA SNP后仅微增至0.810,表明HLA区域变异足以提供绝大多数预测信息。
研究结论强调,基于SNP的T1D GRSHLA与基于HLA等位基因的模型在不同祖先群体中表现相当,这具有重要意义,因为SNP分型技术更经济、更易标准化推广。跨祖先组合模型T1D GRSHLA-ALL在不同群体中表现一致优异,甚至优于部分祖先特异性模型,这可能得益于大样本量带来的统计效能提升以及模型对祖先特异性风险变异的覆盖能力。
讨论部分指出,HLA区域受到自然选择压力,导致等位基因频率和效应大小存在祖先差异。例如,最强关联SNP rs9273363在AFR群体中的优势比(OR=5.56)高于其他群体,而其 tagging 的HLA-DQB1 * 03:02等位基因在AFR群体中OR值仅为1.68,表明不同祖先群体中存在不同的主要风险等位基因。这种复杂性凸显了开发跨祖先风险预测模型的必要性。
该研究的实际意义在于:为全球范围内T1D风险预测提供了标准化工具,克服了现有GRS模型的欧洲中心偏倚;证明相对廉价且易标准化的SNP分型可替代复杂的HLA分型,降低大规模筛查成本;为多族裔人群的精准糖尿病预防和早期干预奠定基础。
研究同时承认存在一定局限性:非欧洲裔样本量相对不足;南亚和东亚群体因样本过少被排除;训练集与测试集存在重叠可能影响性能评估。这些局限也指明了未来研究方向:扩大非欧洲裔队列规模;探索更多祖先群体的特异性变异;开展前瞻性验证研究。
总之,这项研究首次系统证实了跨祖先HLA聚焦型GRS在多族裔T1D风险预测中的有效性和实用性,为实现全球性、标准化的T1D遗传筛查提供了重要工具,推动了糖尿病精准预防向更加公平、普惠的方向发展。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号