综述:营养基因组学与多组学融合:整合遗传、代谢和微生物组数据用于个性化营养策略
《Genes & Nutrition》:Nutrigenomics meets multi-omics: integrating genetic, metabolic, and microbiome data for personalized nutrition strategies
【字体:
大
中
小
】
时间:2025年11月23日
来源:Genes & Nutrition 3.3
编辑推荐:
本综述系统阐述了多组学技术(基因组学、代谢组学、微生物组学等)与人工智能(AI)在精准营养(Precision Nutrition)领域的整合应用,揭示了其通过解析个体在基因(如FTO、MTHFR)、代谢(如BCAAs、SCFAs)及肠道菌群(如Prevotella/Bacteroides肠型)层面的差异,实现对2型糖尿病(T2D)等慢性疾病的精准干预和健康管理的巨大潜力。
理解组学层面:系统生物学方法
精准营养的演进离不开系统生物学的视角,该方法通过剖析层级化的组学数据来解读代谢的个体差异性。实践者系统分析多个生物学层面,包括基因组、表观基因组、转录组、蛋白质组、代谢组和微生物组。每个独特的层面为个体代谢表型提供独特见解,同时强调了这些过程之间相互关联的本质。这种策略利用多种生物标志物,特别提供了遗传因素、环境毒素和生活方式选择在塑造健康结果方面相互作用的全面概览。此外,纳入营养素有助于生物标志物的分析。
不同的组学层面遵循信息层级结构。基因组变异已被证明是生物体基本代谢能力的首要决定因素。表观基因组修饰对于使网络能够响应细胞环境变化至关重要。转录组模式显示细胞的实时状态。蛋白质组谱是当前活跃通路的指标。代谢组特征的确定取决于通量。微生物组的组成提供了营养过程和营养生物利用度的洞察。这种基础层级为探索作为营养变异性基石的基因组学奠定了基础,动态层面构建于静态的遗传蓝图之上。认识到这些相互联系使得能够更精确地预测个体对特定饮食策略的反应。
基因组学:营养个体性的基础
在此组学框架基础上,基因组学为代谢潜力提供了静态蓝图。该领域已从单基因研究发展到捕捉累积遗传影响的多基因模型。
营养基因组学与多基因风险评分
现代营养基因组学领域已从候选基因研究发展到多基因风险评分(PRS)分析,其反映了数千个基因对营养效应的累积影响。2024年“我们所有人研究计划”的分析确定了1,247个影响不同人群饮食反应的遗传变异,从而显著提高了精准营养干预的预测准确性。这些PRS模型在预测对主要饮食模式反应方面实现了0.75-0.85的曲线下面积(AUC)值,从而显示出相对于临床风险因素的显著优越性。扩展这些多基因见解,最近的基因组研究阐明了糖尿病风险中祖先特异性变异,将遗传架构与通路水平机制联系起来。最近关于基因组的研究表明,某些非传统因素影响患2型糖尿病的可能性。此外,基因表现出变异。这些基因与mTOR、AMPK、FXR和TGR5信号通路的变化有关。等位基因频率和效应大小在祖先群体中的变化已成为遗传架构的重要生物学考虑因素。正如De la Pena-Armada等人(2025年)所证明的,影响淀粉消化的AMY1基因变异在历史上消费高淀粉饮食与低淀粉饮食的人群之间,其频率存在数量级差异。
关键遗传变异与功能影响
FTO基因变异与代谢调节:脂肪质量和肥胖相关(FTO)基因已被确定为饮食反应变异性的高度可靠遗传预测因子。最近关于FTO的功能研究揭示了食欲调节之外的机制,暗示其参与线粒体代谢和产热作用,影响能量稳态和脂肪细胞分化。携带特定遗传变异的个体,例如rs9939609风险等位基因,倾向于对不同饮食脂肪类型和数量表现出不同的反应。如最近分析所示,此类个体在高饱和脂肪饮食中体重增加高出23%;然而,在补充中链甘油三酯时,其体重增加减弱。最近的一项临床试验表明,针对FTO携带者的个性化干预措施,侧重于改善脂肪质量(例如,优先选择不饱和脂肪和中链脂肪)而非数量,与标准低脂饮食相比,有效率(定义为实现体重减少≥5%的比例)提高了34%。
MTHFR变异与一碳代谢:亚甲基四氢叶酸还原酶(MTHFR)基因编码一种对叶酸代谢和一碳转移反应至关重要的酶,影响DNA甲基化和同型半胱氨酸再甲基化。多态性,特别是C677T(rs1801133)和A1298C(rs1801131),将酶活性降低30-70%。这种降低导致同型半胱氨酸水平升高和甲基化水平紊乱。纯合C677T变异的全球患病率在不同人群中从10%到20%不等。在临床上,这些变异与心血管疾病(CVD)风险增加相关;2023年对66项研究(n=37,263)的荟萃分析表明,在显性(OR=1.16, 95% CI: 1.06-1.28, P=0.008)和隐性(OR=1.20, 95% CI: 1.12-1.28, P<0.001)模型下,C677T携带者心肌梗死(MI)的几率高出13-20%,A1298C也有类似但边际显著的关联(隐性OR=1.27, 95% CI: 1.06-1.51, P=0.008),强调了在CVD预防中进行遗传筛查的必要性。TT基因型独立地增加了脑小血管病患者进展和损伤的风险(OR=2.45, 95% CI: 1.32-4.55, P=0.005),将高同型半胱氨酸血症与神经退行性通路联系起来。在表观遗传学上,变异损害全局DNA甲基化,但补充可以恢复甲基化谱,如2024年一项随机试验所示,其中叶酸使变异携带者代谢基因的甲基化增加了15-25%。这强调了个性化叶酸推荐的必要性:基于最近的生物标志物研究,复合杂合变异需要每日800-1200μg以优化甲基化,而野生型变异需要400μg。必须承认叶酸补充剂的效果因遗传背景而异,支持量身定制的干预措施以减轻CVD、认知和表观遗传风险。
时间基因组学变异:生物钟基因的遗传变异导致在进餐时间和宏量营养素分布方面存在相当大的个体间差异。CLOCK基因的变异已被证明可以调节胰岛素敏感性的节律。携带次要等位基因的个体在早餐时表现出比晚餐时高40%的血糖反应。PER2基因的变异已被证明影响个体的褪黑素产生。此外,这些变异可能影响睡眠与新陈代谢之间的关系。因此,需要使喂养时间表适应个体时型以优化新陈代谢。
药物基因组学-营养相互作用
大量临床建议来自药物基因组学与营养学的交叉领域。影响药物代谢的遗传变异也会影响营养代谢,为联合治疗提供了机会。已经证明CYP2D6的变异会影响膳食前体转化为生物活性形式以及药物的代谢。类似地,ATP合酶(ATP)结合盒转运蛋白(ABC转运蛋白)的变异可以改变药物外排和营养吸收。因此,这两个因素必须整合到患者治疗中。
表观基因组学与转录组学:动态环境接口
单细胞表观基因组分析
单细胞表观基因组技术的进步为饮食干预的组织和细胞类型特异性反应提供了非凡的见解,提供了前所未有的分辨率。单细胞CUT&Tag和ATAC-seq技术已经发展到在单细胞水平绘制染色质可及性和组蛋白修饰,从而揭示先前被认为是同质的组织中的异质性反应。使用这些方法的实验结果表明,高多酚饮食在2周后诱导肝细胞、脂肪细胞和免疫细胞中不同的组蛋白修饰。此外,组蛋白修饰与增强的胰岛素反应和降低的炎症标志物显示出强相关性。
纵向单细胞表观基因组全关联研究(scEWAS)改变了我们对饮食如何随时间影响染色质的理解。根据现有文献,坚持地中海饮食产生的积极表观遗传变化以波浪形式显现。这表明初始阶段包括第1周和第2周代谢基因的激活。随后,第3-8周发生炎症和免疫调节变化。最近的研究已经确定表观遗传反应性的个体差异是干预成功的重要预测因子。此外,表现出快速表观遗传反应的参与者显示出代谢生物标志物的显著改善,包括降低的同型半胱氨酸水平、增加的血清叶酸和降低的LDL-C,这与富含多酚的绿色地中海饮食干预中多酚驱动的DNA甲基化变化有关。
营养素特异性表观遗传修饰
甲基供体营养素:甲基供体(叶酸、蛋氨酸、胆碱、甜菜碱)的可用性已被证明与各种DNA甲基化模式相关,如高分辨率甲基化组图谱所证明。可以使用靶向亚硫酸氢盐测序 panel 识别指示特定营养缺乏的甲基化特征。补充后甲基化的恢复随时间、基因组区域和基线甲基化状态而异。然而,代谢基因CpG岛的甲基化表现出最快的恢复。
膳食多酚诱导的表观遗传改变,例如来自绿茶、浆果和橄榄油的多酚,具有独特的表观遗传特征。这些化合物已被证明具有抗炎和心脏保护特性。研究人员已经鉴定出对多酚有反应的新增强子区域。摄入后,这些区域变得可接近并增强抗氧化和解毒基因的表达。在摄入后数小时内即可检测到对药物消耗的反应变化,并且可以观察到慢性摄入的效果。
饮食干预的转录组反应
从固定的表观遗传特征转向流动的基因活动,转录组学追踪营养信号对细胞的即时变化,揭示基因型如何与饮食相互作用以重塑新陈代谢。这些受遗传影响的转录组变化支撑了生酮饮食的有效性,强调了个性化代谢评估的必要性。值得注意的是,生酮方案上调脂肪酸氧化、酮生成和糖异生,同时下调糖酵解,转变速度与变异体相关。基线代谢适应性预测坚持成功的可能性,使得疗效依赖于基因型。
跨代表观遗传效应
新出现的证据表明,饮食模式可以影响生殖细胞中的表观遗传标记,可能通过跨代遗传影响后代的健康。人类研究记录了父母饮食质量与出生时后代甲基化模式之间的关联,对代谢编程和疾病风险具有影响。这项研究强调了精准营养超越个体健康,对家庭和人群层面结果的更广泛影响。
蛋白质组学:营养状态的功能性读数
先进的蛋白质组技术及应用
当前的蛋白质组学方法基于高通量质谱、基于适配体的阵列和邻近延伸测定,用于从生物样品中同时定量数千种蛋白质。这些仪器可以检测饮食改变后的蛋白质表达的细微变化,从而提供功能读数,建立遗传易感性与观察到的表型之间的相关性。数据非依赖采集(DIA)质谱定量准确性和可重复性的最新进展显著提高了蛋白质组学在临床应用中的适用性。
我们为营养研究开发了专注于炎症、代谢和心血管健康的靶向蛋白质组学 panel。这些测定可以在饮食改变后24至48小时内量化关键生物标志物,从而评估干预效果。炎症标志物(例如,C反应蛋白、白细胞介素-6和肿瘤坏死因子α)和代谢激素(例如,胰岛素、瘦素和脂联素)的高灵敏度测定提供关于饮食方案的即时反馈。
饮食诱导的蛋白质组特征
炎症反应模式:越来越多的研究表明,高脂饮食持续产生以促炎蛋白升高和抗炎介质降低为特征的蛋白质组特征。然而,个体遗传背景已被证明显著调节这些反应。携带CRP中特定基因变异的个体在摄入饱和脂肪时表现出加剧的炎症反应(增加2.3倍)。相反,携带特定IL-6启动子多态性的个体在炎症消退方面对omega-3脂肪酸表现出更有利的反应。
代谢通路激活:蛋白质组分析揭示了与不同饮食模式相关的独特代谢通路特征。地中海饮食已显示增加有助于疾病预防和为细胞提供能量的蛋白质水平。这些蛋白质在调节血糖水平中起关键作用。生酮饮食具有类似效果但强调脂肪。临床生物标志物的可测量改变通常在响应干扰的代谢变化后显现。这些蛋白质组变化通常先于临床生物标志物的可测量变化,为干预成功提供早期指标。
时间动态与个性化应用
蛋白质组反应的时间动态在个体和饮食干预之间存在显著差异。急性期蛋白在高脂餐后数小时内达到峰值,而代谢酶的适应性变化发生在数天至数周内。了解这些时间模式使得能够优化干预时间和监测计划。一些个体表现出延长的炎症反应,需要修改饮食方法,而快速代谢适应者可能受益于更频繁的饮食循环。
营养蛋白质组学——定义为应用高通量蛋白质组学技术研究营养-蛋白质相互作用、饮食对蛋白质组动态的影响以及用于营养状况和个性化健康干预的生物标志物——有潜力促进代谢功能障碍的早期识别和心血管风险预测,以及监测对干预的反应。这些蛋白质组生物标志物 panel 已被证明在预测特定人群心血管事件方面优于常规血脂 panel。这些应用正从研究环境转向临床实践,目前有几个商业平台提供用于精准营养的蛋白质组分析,例如Inside Tracker和SomaLogic的Soma Scan检测,它们提供对数千种循环蛋白质的消费者可访问的见解——包括炎症标志物(例如,IL-6,hsCRP反应监测)、代谢指标(例如,用于脂质和能量调节的ApoB,脂联素)和营养状况生物标志物(例如,用于铁储存的铁蛋白,用于蛋白质充足性的白蛋白)——以生成可操作的饮食计划,旨在减少炎症、增强代谢灵活性和纠正缺陷。虽然侧重于商业应用,但蛋白质组分析在健康以及个性化营养中正在激增。
代谢组学:实时代谢表型分析
先进的分析平台与技术
当代代谢组学平台已通过先进的分析技术得到进一步增强,包括核磁共振(NMR)光谱、液相色谱-质谱(LC-MS)和气相色谱-质谱(GC-MS)。这些平台提供全面的代谢物覆盖,包括极性和非极性化合物。这些集成的分析方法使研究人员能够利用每种技术的互补优势捕获更广泛的代谢组。高分辨率质谱和离子迁移分离的最新进展已将可检测代谢组扩展到每个样品超过50,000个特征,从而能够发现新的生物标志物和代谢通路。
针对特定代谢通路的靶向代谢组学 panel 已为临床应用而开发,提供关键代谢物的绝对定量以指导个性化营养和监测治疗反应。这些 panel 快速评估氨基酸代谢(例如,支链氨基酸如亮氨酸和缬氨酸作为胰岛素抵抗和蛋白质分解代谢的指标)、脂质氧化(例如,反映β氧化效率和脂肪酸转运的酰基肉碱)、能量代谢(例如,用于线粒体功能和生物能量学的三羧酸循环中间体如柠檬酸盐和琥珀酸盐)和肠道微生物组衍生代谢物(例如,用于抗炎作用和纤维利用的短链脂肪酸如丁酸盐),所有这些都具有高精度和可重复性。一个值得注意的例子是Metabolon用于微生物组和肠道代谢组研究的靶向 panel,其定量来自纤维发酵的9种短链脂肪酸和参与脂质消化及FXR/TGR5信号传导的21种胆汁酸,通过饮食干预促进对炎症性肠病、糖尿病和代谢综合征等疾病的生物标志物识别。标准化参考材料和质量控制程序的发展提高了实验室间的可比性,促进了向临床实践的转化。
代谢表型分析与个体差异
代谢组学的应用使得能够观察个体在特定时间的代谢过程。因此,代谢组学促进了个体在营养处理、能量代谢和代谢灵活性方面差异的研究。最近的研究表明,餐后代谢过程,包括糖、脂肪和蛋白质的处理速率,表现出个体间变异性。代谢差异与遗传因素、微生物组组成和饮食习惯密切相关。
几项研究已经确定了支持减肥、胰岛素敏感性和代谢健康的不同代谢组学特征。例如,在肥胖儿童进行减肥干预时,代谢组学分析显示干预后支链氨基酸(BCAAs,例如亮氨酸和异亮氨酸)和酰基肉碱水平降低,与改善的胰岛素敏感性和HOMA-IR评分提高15-20%相关,突出了这些作为代谢灵活性的预测性生物标志物。类似地,富含纤维饮食后胆汁酸的变化,例如鹅去氧胆酸升高,与成人糖尿病前期患者改善的血糖控制和减少的炎症相关,微生物组衍生的特征如丁酸盐增加预测减肥成功率高25%。BCAAs、酰基肉碱、胆汁酸和微生物衍生代谢物的变化常常是指标。功能性代谢组学特征在预测个体对饮食干预的反应方面显示出前景。目前对多种结果的预测准确性超过80%。这种通过代谢表型分析进行的个体水平表征为代谢分型奠定了基础,代谢分型通过将特征分类为可重复的亚组用于靶向临床策略来完善这些见解。
代谢分型与临床应用
代谢分型表示基于代谢组学特征将个体分类为不同的代谢亚组。应用于大型代谢组数据集的高级机器学习算法已经识别出对饮食干预反应不同的可重复代谢类型。例如,具有“脂肪生成”代谢型的个体在低碳水化合物饮食中表现出胰岛素敏感性(例如,HOMA-IR降低25%)和减肥效果(例如,12周内体重减少≥5%)的更大改善,而“氧化”代谢型在遵循高纤维、植物性方法时表现出增强的血糖控制(例如,HbA1c降低0.7%)和减少的炎症标志物。代谢组学指导的营养的临床实施正在通过与电子健康记录(EHR)和临床决策支持系统集成而推进。床旁代谢组学设备正在开发中,有望将实时代谢评估带入临床环境。早期研究表明,代谢组学指导的干预通过实现更精确的治疗靶向改善患者结局并降低医疗成本。
整合挑战与未来方向
代谢组学已取得显著进展;然而,标准化平台、制定参考范围和解译代谢组学数据仍然是挑战。代谢组是一个动态系统;因此,样品收集和储存的时间与方法在代谢组学研究中至关重要。将组学层与其他学科整合需要有效使用计算工具来管理高维、多模态数据。该领域即将到来的进展有望扩大代谢组覆盖范围、提高定量精度并培养用户友好的临床解译工具。将代谢组学与连续监测技术整合使得能够基于代谢特征的连续评估实时优化营养干预。
微生物组学:体内的代谢器官
先进的微生物组分析技术
当前微生物组分析已从16S rRNA基因测序发展到全面的鸟枪法宏基因组学、宏转录组学和宏蛋白质组学方法,为微生物群落活动提供功能见解。长读长测序技术能够实现单个微生物的完整基因组组装,揭示显著影响代谢能力和饮食反应的菌株水平变异。快速测序平台现在能够在24-48小时内实现微生物组分析,使得实时微生物组指导的饮食建议变得可行。标准化样品收集方案和参考数据库提高了跨研究和临床应用的可重复性和可比性。用于微生物组工程的合成生物学方法的发展为治疗干预开辟了新的可能性。
肠型与饮食反应预测
肠型概念已从基于分类学的微生物群配置(由特定细菌属主导)演变为基于功能的配置,能够消耗预定义的生态资源。当代的肠型分型方法涉及分析参与纤维分解、短链脂肪酸产生、胆汁酸代谢和异生物质处理的重要功能基因。在高纤维饮食的背景下,肠道微生物组中普雷沃菌占主导的个体对饮食干预表现出更显著的代谢反应,其特征是有益代谢物(例如,短链脂肪酸如丁酸盐)产量增加45%更大,以及炎症标志物水平改善(例如,降低的C反应蛋白和白细胞介素-6),与那些肠道微生物组以拟杆菌为主的个体相比。相反,以拟杆菌为主的微生物组已被观察到对膳食脂肪和蛋白质的处理效率更高。这一观察表明存在针对特定微生物组特征精心定制的宏量营养素最佳分布。在预测模型中使用人工智能和微生物组功能特征已成为一种复杂的方法,以准确预测个体对特定饮食方案的反应。这些模型考虑了微生物组的组成和代谢通路的完整性。最近的研究表明,预测血糖反应的准确性超过85%,预测减肥的准确性超过78%。
微生物组-代谢物相互作用
微生物组和代谢组数据的整合揭示了微生物衍生代谢物在宿主健康和饮食反应中的关键作用。微生物纤维发酵产生的短链脂肪酸作为影响炎症、代谢和免疫功能的关键信号分子。短链脂肪酸生产能力的个体差异与膳食纤维干预的代谢和炎症反应密切相关,包括改善血糖控制和降低促炎细胞因子如白细胞介素-6。例如,一项2024年使用鸟枪法宏基因组学和靶向代谢组学的多队列研究表明,富含普雷沃菌的微生物组从可溶性纤维(如菊粉)中增强丁酸盐生产,导致在12周内与拟杆菌主导的特征相比,HbA1c水平和IL-6浓度降低20-30%更大,强调了精准营养中纤维类型个性化的必要性。这些微生物组-代谢物相互作用突出了通过干预优化宿主代谢灵活性和降低慢性疾病风险的机会。
胆汁酸代谢代表了另一个关键的微生物组-宿主相互作用通路。特定的细菌菌株拥有产生具有独特生理效应的次级胆汁酸的胆汁酸代谢酶。个体拥有这些细菌能力影响他们对膳食脂肪和降胆固醇干预的反应。细菌可以合成多酚,已被证明具有抗炎特性并有助于心血管健康。人类可以从鞣花单宁合成代谢物如尿石素A,从大豆异黄酮合成雌马酚。由于微生物组组成的差异,这种现象可能因人而异。因此,存在由肠道微生物组指导制定植物营养素建议的充分机会。
临床转化与微生物组驱动营养中的可操作生物标志物
尽管微生物组分析可以通过识别肠型、生态失调特征和代谢物来增强精准营养,这些特征预测成功的干预,如纤维或益生菌补充,但大多数研究继续专注于识别可操作的、用户友好的生物标志物,以促进实时饮食改变。例如,最近的多组学研究已经验证粪便短链脂肪酸水平和α多样性指数作为对益生元纤维血糖反应的代理指标。因此,机器学习模型在2型糖尿病队列中分层应答者方面达到了85%的准确性。尽管从初步人体试验中得到了这些令人兴奋的发现,但我们不能操之过急;将其转化为临床实践的一个显著限制是缺乏支持基于微生物组干预的稳健长期证据。大多数研究样本量小,测序方法存在差异,基于微生物组的产品仓促、粗糙的展示阶段,这进一步阻碍了更广泛的使用。未来的努力应专注于大规模随机对照试验与标准化,以建立因果关系和成本效益,确保微生物组应用不仅用于研究环境,而且为常规营养护理提供基于证据的建议。
微生物组学:对营养生物利用度的见解与关键挑战
肠道微生物组是有益的细菌生态系统,有助于在肠道中消化食物。有益效果包括调节代谢、产生短链脂肪酸和调节宿主免疫。这些是使用益生元和益生菌进行个性化营养的潜在目标。根据多组学研究,个体对膳食纤维和多酚的反应与微生物组组成有关。对于一项关于从微生物特征预测餐后血糖偏移的多国研究,这些研究使用了准确率达85%的机器学习模型。尽管微生物组研究取得了进展,但由于个体间高变异性、测序方案的方法学差异以及跨队列的低可重复性,将微生物组数据转化为临床实践为时过早。例如,饮食混杂因素和批次效应可能掩盖特定微生物分类群与其代谢结果之间的因果关系。纵向研究表明,微生物组特征随时间仅适度稳定。此外,关于微生物组生物样本库中数据隐私的伦理问题以及标准化功能测定的不可用性阻碍了可扩展实施,表明需要跨更多样化人群进行更大规模的试验以验证预测。尽管微生物组指导的精准营养具有巨大潜力,但这些限制应缓和期望,并培养从实验室到临床的谨慎乐观态度。
多组学整合:系统水平营养分析
从单组学分析转向多组学分析标志着精准营养研究和临床应用的范式转变。这一转变是由复杂的计算过程整合所驱动,这些过程系统地将不同类别的生物数据组合起来,以高精度和临床相关性生成可操作的营养信息。例如,整合代谢组、基因组和临床数据的多组学模型在识别对饮食干预的代谢反应方面实现了AUC为0.90的预测准确性,从而实现了更有针对性和有效的个性化策略。
当代多组学整合采用先进的AI框架,包括为生物数据专门设计的Transformer和图神经网络以及基础模型。这些方法可以处理组学数据的复杂性、高维度和多尺度性质,同时识别通过单层分析不可能检测到的有意义的模式。该工作流程的一个关键实践方面是饮食干预后建议的48-72小时样品收集时间范围,这允许解决急性餐后波动,同时捕获转录组、蛋白质组和代谢组谱的早期适应性变化,而不会引入来自长时间延迟(如昼夜节律中断或微生物漂移)的混杂因素。这个时间窗口优化了下游AI驱动表型分析的数据质量,如在纵向微生物组-代谢组研究中所示,其中干预在72小时期间评估,以>80%的准确性预测血糖和炎症结果。数据标准化在多组学工作流程中至关重要,以确保研究的可重复性和互操作性。表2提供了标准化关键组学数据集的指南,侧重于基因组变异、代谢物定量和微生物分析的协调协议。这些指南来自最近的联盟建议(例如,ELIXIR和代谢组学标准倡议),以解决批次效应、参考范围和数据融合问题。示例性生物标志物如FTO(影响脂肪代谢和肥胖风险的rs9939609变异)、MTHFR(影响叶酸一碳代谢和CVD易感性的C677T多态性)和GWAS衍生的位点(例如,>1,247个与营养反应相关的变异)基于它们在营养基因组文献中的高普及率和在多组学模型中的已验证预测能力(用于饮食反应预测的AUC 0.75-0.85)被选入。这些标志物示例了指南的应用,因为它们需要标准化变异调用(例如,通过GATK流程)、甲基化调整定量和通路水平整合,以减轻祖先特异性偏见并增强跨队列可比性。
图1a. 通用多组学整合框架。此综合工作流程说明了精准营养研究中多组学数据的整合。此过程始于五个基本输入数据流:基因组学(包括单核苷酸多态性和营养遗传变异)、转录组学(反映动态营养反应的基因表达谱和RNA-seq数据)、代谢组学(连续葡萄糖监测数据和代谢物谱)、微生物组学(肠型分类和微生物分类数据)和蛋白质组学(炎症生物标志物和蛋白质组特征),样品收集理想在饮食干预后48-72小时内,以捕获稳定但反应灵敏的分子特征。这些不同数据集的处理由AI和机器学习框架促进,包括LightGBM算法、多类多层感知器网络、聚类算法和数据融合算法,这些算法将数据整合到统一的营养表型分类系统中,该系统执行模式识别、表型聚类和将个体分层到不同的营养类别。AI/ML:人工智能/机器学习;CGM:连续葡萄糖监测;FTO:脂肪质量和肥胖相关基因;Light GBM:LightGBM;McMLP:多类多层感知器;MTHFR:亚甲基四氢叶酸还原酶基因;SNPs:单核苷酸多态性。
先进的计算整合框架
联邦学习方法:多机构数据整合遇到重大挑战,包括数据隐私问题、批次效应和机构间差异。联邦学习的最新进展使得能够在不要求集中数据共享的情况下,以保护隐私的方式整合来自多个机构的多组学数据集。多组学数据整合工作流程呈现在表2中。
张量分解方法:高维多组学数据整合受益于基于张量的方法,这些方法可以处理缺失数据
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号