早产与自闭症谱系障碍遗传易感性的交互作用:多组学队列分析与机器学习预测模型

【字体: 时间:2025年10月03日 来源:Genome Medicine 11.2

编辑推荐:

  本研究针对早产与自闭症谱系障碍(ASD)的交互机制,通过分析SPARK和SSC两大队列78,559例表型数据和12,519例全基因组数据,发现早产ASD患者虽携带与足月ASD相似的遗传负荷,却表现出更严重的多病症表型(OR=2.18)。研究首次建立基于出生时可获特征的机器学习预测模型(AUROC=0.65),证实罕见新生变异(DNV)负荷与多病症显著相关(p=0.005),且多基因风险评分(PRS)与早产对ASD风险具有叠加效应。这些发现为早产儿ASD早期筛查提供了遗传学依据。

  
自闭症谱系障碍(Autism Spectrum Disorder, ASD)是一种复杂的神经发育障碍,以社交互动缺陷、重复刻板行为为核心特征,其病因涉及遗传与环境因素的复杂交互。尽管遗传因素可解释80-90%的患病风险,但环境因素如早产(妊娠<37周)也使ASD风险提高2-4倍。然而,遗传易感性与早产如何共同促成ASD表型异质性,尤其是早产ASD患儿是否具有独特的临床和遗传特征,仍是未解之谜。
为回答这一问题,由Zhang等人在《Genome Medicine》发表的研究,整合了Simons基金会两大核心队列——SPARK(Simons Foundation Powering Autism Research for Knowledge)和SSC(Simons Simplex Collection)的数据,涵盖78,559例表型样本、12,519例全基因组测序(GS)和8,104例外显子组测序(ES)数据。研究通过表型对比、遗传负荷分析和机器学习建模,系统揭示了早产与ASD的交互机制。
研究采用的主要技术方法包括:基于SPARK v9和SSC队列的表型数据处理与多病症分类;全基因组/外显子组测序数据的罕见新生变异(de novo variant, DNV)与遗传变异调用(使用Slivar、GATK等工具);多基因风险评分(Polygenic Risk Score, PRS)计算(基于PRS-CS算法和 Psychiatric Genomics Consortium的GWAS摘要统计数据);广义估计方程(Generalized Estimating Equations, GEE)模型校正家族聚类效应;以及基于XGBoost、随机森林和支持向量机(SVM)的机器学习预测模型构建。
一、早产ASD患者表现出更严重的多病症表型尽管遗传负荷相似
通过比较ASD-早产(n=9,196)、ASD-足月(n=65,021)和非ASD-早产(n=2,706)三组,研究发现早产ASD个体在9类诊断类别(如行为、发育、生长、神经疾病等)的患病率均显著更高(p<0.001)。其中,出生相关并发症和生长问题的比值比(OR)最高(均为2.18)。更重要的是,早产ASD患者的多病症(同时罹患≥5类疾病)风险显著增加(p<2.2×10-16),且极端早产(<28周)个体的多病症负担最重。定量评估显示,早产ASD在儿童行为量表(CBCL)、发育协调障碍问卷(DCDQ)和社交沟通问卷(SCQ)等评分上均表现更差(p<0.05)。这些结果表明早产可能加剧ASD的临床严重性,且独立于遗传背景。
二、遗传分析揭示早产ASD的罕见变异负荷与多病症相关
全基因组测序分析显示,ASD-早产与ASD-足月组的DNV事件率无显著差异。然而,外显子组测序数据表明,ASD-早产组比非ASD-早产组携带更多外显子DNV(p=0.005)、NDD基因DNV(p=0.024)和功能缺失突变(LOF)(p=0.018)。此外,通过GEE模型发现,多病症程度与DNV负荷(尤其是ES衍生的LOF和NDD基因突变)呈正相关(p=1.1×10-5~6.6×10-14)。遗传模式分析未发现显性或隐性遗传变异在组间存在差异,提示罕见新生变异而非遗传变异可能是早产ASD的重要遗传基础。
三、多基因风险评分与早产对ASD风险具有叠加效应
PRS分析表明,ASD个体的PRS显著高于非ASD个体(p=6.7×10-13),但ASD-早产与ASD-足月组的PRS分布无差异。GEE逻辑模型显示,男性性别、早产状态和高PRS均是ASD的独立风险因素(p<2×10-16),且PRS与早产存在交互作用(p=0.017)。预测概率模型表明,PRS最高的早产男性患ASD概率接近90%,凸显了遗传与环境因素的协同效应。
四、机器学习模型证实出生特征对早产儿ASD预测的有限价值
利用13项出生时可获特征(如性别、出生并发症、PRS、CADD评分等)构建的XGBoost模型,对早产儿ASD的预测准确率为69%(AUROC=0.65)。SHAP值分析显示,男性性别、较低胎龄、较高PRS和DNV数量是驱动模型预测的关键特征。尽管模型效能有限,但证明了整合遗传与表型特征在早期筛查中的可行性。
本研究通过多维度分析得出核心结论:早产主要通过加剧多病症表型影响ASD严重性,而非通过增加ASD特异性遗传负荷;然而,罕见新生变异可能提高早产儿罹患ASD的风险;多基因风险与早产对ASD风险具有叠加效应,尤其在男性中更为显著。这些发现不仅深化了对ASD异质性的理解,还为早产儿的早期遗传筛查和干预提供了理论依据。未来在更大规模的前瞻性队列中整合多组学数据,将有望优化ASD的早期预测模型。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号