基于机器学习解析红花种质资源DUS测试性状与生化组成的关联及其对精准育种的启示

《Scientific Reports》:? Uncovering associations between DUS test traits and biochemical composition in safflower germplasm??

【字体: 时间:2025年12月06日 来源:Scientific Reports 3.9

编辑推荐:

  本研究针对红花(Carthamus tinctorius L.)种质资源中地理隔离导致的生化特征同质化及营养性状协同优化难题,通过整合系统地理学、化学计量学和机器学习技术,揭示了红花营养蓝图的形成机制。研究发现新疆种质存在遗传瓶颈驱动生化同质化,地理因素通过阳离子矿物-氨基酸复合体调控区域适应性,并发现矿物质与多不饱和脂肪酸(PUFAs)存在系统性拮抗。机器学习模型进一步表明粗纤维含量因发育程序化而具有较高预测性(R2=0.418)。该研究为气候适应性红花品种的精准育种提供了预测框架。

  
红花(Carthamus tinctorius L.)作为一种兼具药用和油料价值的全球性作物,其干燥管状花在传统中医中被用于活血通经、散瘀止痛,种子油则因高亚油酸含量(可达总脂肪酸的80%)被联合国粮农组织列为三大保健食用油之一。然而,近年来研究发现红花营养和药用成分的积累存在显著地理差异,且关键性状间存在复杂的代谢权衡,例如矿物质与多不饱和脂肪酸的拮抗关系限制了其营养价值的协同提升。此外,主要产区(如中国新疆)的种质资源因长期地理隔离出现遗传瓶颈,导致生化特征同质化,进一步增加了育种难度。传统育种方法难以解析这些非线性关联,亟需整合多组学数据与人工智能技术揭示性状调控规律。
为系统解析红花种质资源的生化特征形成机制,研究团队在《Scientific Reports》发表了题为“Uncovering associations between DUS test traits and biochemical composition in safflower germplasm”的研究。该研究通过对60份代表性红花种质进行表型测定和生化分析,结合主成分分析(PCA)、聚类分析和机器学习建模,揭示了地理隔离驱动的营养特征分化规律及代谢约束机制。
研究采用的关键技术方法包括:基于国家中亚特色作物种质资源中期库的60份红花种质资源采集与标准化田间培育;参照DUS测试指南(NY/T 2753-2015)的表型性状测定;粗纤维、矿物质、氨基酸及脂肪酸等57项生化指标的定量分析(如GB/T 14488.1-2008测脂肪、GB 5009.168-2016分析脂肪酸);基于LightGBM算法的性状预测模型构建与SHAP特征解析。
描述性统计与性状变异性
对57项生化性状的分析显示,红花种质存在广泛表型多样性。粗纤维含量变异系数(CV)为22.58%,脂肪含量CV最低(9.62%),而罕见脂肪酸(如二十碳烯酸、神经酸)CV超过400%,表明其表达具有基因型特异性。遗传多样性指数(GDI)最高为花生四烯酸(0.43)和α-亚麻酸(0.41),提示这些性状具有遗传改良潜力。
系统地理学分析揭示区域遗传瓶颈
基于性状数据的聚类分析显示,新疆种质形成高支持度的单系群,分支短且 bootstrap支持率>85%,表明长期地理隔离导致性状同质化。澳大利亚种质虽成簇但分支较长,反映其在新环境中适应性分化。中国中东部种质呈分散分布,暗示频繁的种质交流。这一结果印证了地理隔离通过限制基因流动强化了区域适应性特征。
地理驱动的化学多样性
PCA分析显示前4个主成分累计解释51%的方差。PC1(26%)揭示东西方种质分化:中国种质(尤其新疆)在正轴聚集,富含谷氨酸(Glu)、天冬氨酸(Asp)及镁(Mg)、钙(Ca),体现碱性土壤适应的阳离子-氨基酸复合策略;近东种质则富集酚醛类次生代谢物。PC2(11.6%)显示ω-3/ω-6多不饱和脂肪酸与萜类前体拮抗,反映温度适应性膜脂重塑。
营养互作网络揭示矿物质-脂肪酸拮抗
相关性分析发现矿物质(K、Ca、Mg)形成共积累簇,但与多不饱和脂肪酸(PUFAs)广泛负相关。铁(Fe)与γ-亚麻酸拮抗最强(r=-0.82),表明氧化应激规避机制。氨基酸居中调解:酸性氨基酸(Asp、Glu)与矿物质正相关但与长链PUFAs负相关,疏水性氨基酸(亮氨酸、缬氨酸)则与饱和脂肪酸协同。这种三元结构体现了膜流动性与离子稳态的代谢权衡。
机器学习模型实现纤维含量预测
LightGBM模型显示粗纤维预测性最高(R2=0.418),显著高于蛋白质(R2=0.247)和钙(R2=0.206)。SHAP分析表明开花株长等形态特征主导纤维预测,营养竞争因子贡献<8%,证实其受发育程序调控而非代谢竞争。该性状因此成为“数量性状岛”,适于标记辅助选择。
研究结论表明,红花生化架构由地理隔离驱动的营养特征保守性及代谢约束共同塑造。新疆种质的生化同质化是遗传瓶颈与碱性土壤适应(阳离子-氨基酸复合)的结果;矿物质-脂肪酸拮抗揭示了氧化应激规避的进化策略;粗纤维的高可预测性源于其发育硬连线特性。该研究不仅为红花营养性状协同优化提供了理论框架,更建立了基于机器学习解析作物代谢约束的范式,对边际农田气候适应性品种选育具有重要启示。未来整合基因组关联分析将有望解析代谢权衡的遗传基础,推动精准育种在药用作物中的应用。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号