基于机器学习建模的基因型-环境互作多变量加权排序:湿地繁殖母牛适应性选择创新方案
《The Journal of Agricultural Science》:Machine learning modelling for weighting and ranking of multiple variables related to genotype-environment interaction: innovative protocol proposal for selecting breeding cows in wetlands
【字体:
大
中
小
】
时间:2025年10月19日
来源:The Journal of Agricultural Science 2.1
编辑推荐:
本研究针对湿地环境中奶牛适应性选育难题,开发了基于机器学习(ML)的动物选择协议。通过梯度提升机(GBM)模型分析血磷、肌酸激酶(CPK)、毛长等关键生理变量与体况评分(CC)的关联,构建了动物适应性选择指数(ISA)。该协议为淡水湿地奶牛繁殖效率提升提供了量化工具,实现了基因型-环境互作机制的精准解析。
在巴拉圭Neembucú湿地这片独特的水生生态系统中,传统牛群养殖正面临严峻挑战。湿热环境导致外来品种奶牛出现繁殖效率低下、生理功能紊乱等问题,而当地两种克里奥罗牛(Criollo Neembuch和Criollo Pilcomayo)虽具环境适应性却濒临灭绝。如何科学评估不同基因型牛只的环境适应能力?怎样建立量化指标来筛选最具适应性的繁殖母牛?这些难题困扰着当地畜牧业发展。
以往研究多采用线性统计模型,难以处理多维生物指标间的复杂非线性关系。随着人工智能技术的发展,机器学习为解析基因型-环境互作(genotype-environment interaction)提供了新思路。《The Journal of Agricultural Science》最新发表的研究通过创新性机器学习协议,成功构建了湿地环境下奶牛适应性选择的量化指标体系。
研究团队采用H2O AutoML框架,对320头来自5个基因型(布拉曼、布兰格斯、内洛尔及两种克里奥罗牛)的母牛进行四季跟踪监测。通过梯度提升机(GBM)模型分析32个动物福利和代谢参数,最终筛选出11个关键变量建立预测模型。技术方法核心包括:60/40数据集分层分割、五折交叉验证防止过拟合、基于RMSE和MAE的模型选择标准,以及SHapley加法解释(SHAP)进行变量重要性排序。
通过机器学习建模发现,季节与基因型组合因素解释33%的体况评分(Body Condition Score, CC)变异,血磷(phosphatase)和肌酐(creatinine)分别贡献12.3%和11.7%。梯度提升机模型(GBM_grid_1_AutoML_2_20240405_212421_model_469)表现最优(RMSE=0.583,MAE=0.471),其预测值与实测值显著相关(P<0.01)。
SHAP分析揭示:低血磷(<488 IU/ml)和低肌酸激酶(CPK)水平与高体况评分正相关。冬季胆固醇升高对体况产生负面影响,而血磷浓度升高普遍导致CC下降。值得注意的是,毛发长度超过标准化值0.5时(约2.08cm实测值),体况评分显著降低,这在秋季尤为明显。
高血细胞比容(haematocrit)和血红蛋白(haemoglobin)水平显著改善体况评分。当血红蛋白标准化值>0.5时,每增加0.1单位可使CC提升0.15分。夏季高温环境下,内洛尔牛呈现血细胞比容下降特征,而克里奥罗品种维持稳定水平。
冬季对所有基因型体况评分产生强烈负面影响,其中内洛尔牛受影响最严重(SHAP值-0.35)。夏季则普遍呈现正向效应,克里奥罗Neembuch品种在秋季表现最佳。体温监测显示,38-39.3°C的正常范围内体温波动与体况稳定密切相关。
基于变量权重分析,研究提出动物适应性选择指数(ISA)计算公式:
ISAn = Σi=1NVR(SIi × FMi)2
通过标准化处理(ISAstd = 100 × ISA/ISAmax)得到0-100分的适应性评分。对10头示范牛只评估显示,ID24号牛获得最高评分(94分),其血磷、CPK等关键指标均处于理想范围。
该研究首次将机器学习应用于湿地畜牧业适应性选育,成功破解了多变量非线性关联的解析难题。通过SHAP解释模型明确揭示了血磷代谢、毛发特性(hair coat characteristics)和热应激 biomarkers(CPK、血红蛋白)在环境适应中的核心作用。提出的ISA指数创新性地采用二次加权计算,更精准地捕获了关键变量的阈值效应。
这项研究为全球湿地畜牧业提供了可推广的适应性选育范式,其方法论意义超越畜牧学领域:机器学习驱动的重要性排序机制可用于任何基因型-环境互作研究;SHAP解释框架为复杂生物系统的可解释人工智能提供了成功案例;二次加权指数计算方法为多指标综合评价体系设立了新标准。尤其重要的是,该研究为保护濒危地方品种(克里奥罗牛)提供了科学依据,证明其湿地适应性优势,为生物多样性保护与农业生产的协同发展提供了典范。
研究建立的协议正在巴拉圭Neembucú湿地推广应用,通过多机构协作(生产者协会、政府机构、科研院所)建立区域性育种体系。随着该系统的完善,预计可在3-5年内培育出适应湿地环境的高产奶牛群体,实现畜牧业生产与生态保护的和谐统一。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号