
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于无人机多源数据融合与Stacking集成学习的烟草淀粉含量高精度预测模型研究
【字体: 大 中 小 】 时间:2025年06月10日 来源:Industrial Crops and Products 5.6
编辑推荐:
本研究针对传统烟草淀粉含量检测方法耗时昂贵、单一模型预测精度不足的问题,创新性地结合无人机高光谱与可见光影像数据,采用SiPLS特征选择与Stacking集成学习(SVR+GRU+MLP)构建预测模型,实现R2 达0.97、RMSE降至1.50%的突破性精度,为作物品质无损监测提供新范式。
烟草作为重要经济作物,其淀粉含量直接影响香气品质和工业价值。传统检测依赖高效液相色谱(HPLC)等实验室方法,存在破坏样本、耗时昂贵等问题,难以满足大田实时监测需求。尽管无人机遥感技术为作物表型分析带来革新,但现有研究多局限于单一数据源或简单模型,面对复杂田间环境时预测精度受限。如何融合多源遥感数据、突破算法瓶颈,成为精准农业领域亟待解决的科学问题。
福建省烟草专卖局联合高校科研团队在《Industrial Crops and Products》发表研究,创新性地将无人机高光谱(400-1000nm)与可见光影像相结合,通过协同区间偏最小二乘法(SiPLS)筛选10个特征波段(如709.97nm、808.61nm),提取颜色(ExGR、CIVE)和纹理特征(GLCM、LBP)。研究采用Stacking集成框架,以支持向量回归(SVR)和门控循环单元(GRU)为基学习器,多层感知机(MLP)为元学习器,构建多模态融合预测模型。实验覆盖福建6个试验区的不同品种(翠碧1号、云烟87)和施肥梯度(T0-T200),通过SMOTE算法增强数据多样性。
图像分割
采用U2-Net网络实现烟草植株区域分割,F1分数达96.67%,为特征提取奠定基础。
特征筛选
对比PCA、SPA等5种方法后,确定SiPLS筛选的10个波段组合最优(R2
=0.79),其中蓝紫光区(400-437nm)和红边波段(709-718nm)贡献显著。
机器学习对比
SVR在融合图像特征后表现最佳(R2
=0.88),优于XGBoost等算法,验证核函数对高维数据的适应性。
深度学习对比
GRU凭借门控机制处理序列数据优势,在融合数据集上R2
达0.94,较LSTM参数效率提升30%。
集成学习验证
Stacking模型将SVR与GRU预测结果通过MLP非线性整合,最终R2
提升至0.97,误差较单一模型降低2.71%。SHAP分析显示GLCM对比度和400.28nm波段贡献度最高,揭示纹理与特定光谱的协同作用。
该研究首次实现烟草田间淀粉含量的多源遥感精准预测,创新点体现在三方面:一是建立高光谱-可见光特征融合体系,证实颜色指标VEG与淀粉含量显著负相关(r=-0.82);二是设计轻量化集成框架(模型仅0.3MB),解决深度学习落地难题;三是跨区域验证表明模型在未知环境(D1-D2试验区)仍保持90%以上精度。相较于传统方法,该技术将检测效率提升20倍,为作物品质智能监测提供可复制方案,未来可扩展至氮磷钾等多参数同步反演。
研究也存在数据地域局限,未来需纳入更多生态区样本。团队计划整合土壤传感器数据,并探索Transformer等新型基学习器,进一步推动精准农业技术革新。
生物通微信公众号
知名企业招聘