基于CNN-ViT混合模型与可解释人工智能的甘薯水分胁迫RGB图像检测系统

《Agricultural Water Management》:Development of a CNN classifier with XAI to detect interpretable water stress in sweet potato using RGB images

【字体: 时间:2025年10月18日 来源:Agricultural Water Management 6.5

编辑推荐:

  本研究针对气候变化下甘薯水分胁迫监测成本高、时效性差的问题,开发了基于RGB图像和深度学习的水分胁迫等级分类系统。通过构建CNN-ViT混合模型,实现了干旱、适宜和湿润三种水分状况的精准识别(准确率达99%),并结合XAI技术可视化胁迫特征区域。该低成本监测方案为田间作物水分管理提供了可解释的决策支持工具,对应对极端气候、保障粮食安全具有重要意义。

  
随着全球气候变化的加剧,干旱和洪涝等极端天气事件频发,对农业生产造成了严重威胁。作为重要粮食作物的甘薯(Ipomoea batatas L.),虽然具有较强的环境适应能力,但其产量和品质仍受到水分胁迫的显著影响。传统的水分胁迫监测方法主要依靠土壤湿度、气孔导度等生理指标测量,这些方法虽然准确但存在破坏性采样、耗时费力等局限,难以实现田间实时监测。尽管高光谱成像等遥感技术能够实现非破坏性检测,但其高昂的成本和复杂的操作限制了在农业生产中的广泛应用。
针对上述问题,韩国庆尚国立大学生物系统工程系的研究团队在《Agricultural Water Management》上发表了一项创新研究,开发了一种基于普通RGB图像和深度学习技术的低成本甘薯水分胁迫监测系统。该研究不仅实现了三种水分胁迫等级(干旱、适宜、湿润)的高精度分类,还引入可解释人工智能(XAI)技术,使模型的决策过程变得透明可解释,为农业生产者提供了可靠的决策支持。
研究人员采用了几项关键技术方法:首先在温室环境下设置了15%(干旱)、27%(适宜)和45%(湿润)三种体积含水量梯度的水分处理,使用固定式RGB相机在特定时间段(早6-7点)采集图像,确保数据一致性。随后构建了七种不同的分类模型,包括三种基准CNN模型(EfficientNetB0、ResNet50、VGG16)和四种混合模型(CNN+RF、CNN+SVM、CNN+ViT、ResNet50+ViT),其中ViT混合模型创新性地将CNN提取的特征图作为Transformer的输入,解决了RGB图像特征维度低的问题。最后采用注意力机制和LIME(Local Interpretable Model-agnostic Explanations)等XAI技术对最佳模型进行可视化解释,并开发了基于Tkinter的图形用户界面(GUI),实现实时分类和灌溉建议功能。

4.1 ML模型

随机森林(RF)混合模型在原始数据条件下达到93%的分类准确率,而支持向量机(SVM)混合模型表现相对较差,特别是在干旱条件下分类准确率较低。数据增强和零值过滤技术的应用显著提升了模型性能,其中RF混合模型在联合使用两种技术时准确率达到96%。

4.2 CNN-based模型

在三种CNN架构中,ResNet50表现最优,验证准确率达到96.77%±1.49%,测试准确率为98%。该模型在干旱和湿润条件下均实现了完美分类(100%准确率),仅在适宜条件下有少量误判。相比之下,VGG16模型性能相对较低,且倾向于将适宜条件误判为干旱条件。

4.3 ViT混合模型

基于自定义CNN的ViT混合模型(C-ViT)在数据增强和零值过滤联合条件下取得了最佳性能,测试准确率达到99%。该模型在三类水分条件下的分类准确率均超过97%,表现出卓越的泛化能力。而基于ResNet50的ViT混合模型(R-ViT)也取得了98%的准确率,但略低于C-ViT模型。

4.4 XAI

可解释性分析显示,注意力图呈现全局分散的关注模式,表明模型考虑了整体上下文特征;而LIME则更精确地突出了叶片上的病斑和变色区域,这些区域在干旱和湿润条件下被强烈识别为影响预测的关键因素。可视化结果与甘薯在水分胁迫下出现的叶缘焦枯(干旱)和花青素积累(湿润)等生理现象高度吻合。

4.5 GUI

开发的GUI界面能够实时显示水分胁迫分类结果、提供灌溉建议,并可视化LIME分析结果。系统还具备数据记录功能,可生成时间序列趋势图,帮助用户追踪作物水分状况的动态变化。
研究结论表明,基于RGB图像的C-ViT模型能够高效、准确地识别甘薯水分胁迫等级,且XAI技术增强了模型的可信度和实用性。讨论部分指出,虽然RGB成像在早期胁迫检测方面不如热成像或高光谱技术敏感,但其低成本、易部署的优势使其非常适合田间大规模应用。研究还发现,甘薯对湿润胁迫的反应比干旱胁迫更为明显,这与其生理特性相符——过量水分会导致储藏根发育受阻、腐烂,造成更大产量损失。
该研究的创新之处在于成功将ViT架构应用于低维RGB图像分析,并通过CNN特征提取解决了小样本数据下的模型训练问题。未来研究方向包括扩大品种覆盖范围、构建多时期数据集,以及开发RGB与热成像等多传感器融合技术,以实现更早期的胁迫检测。这一研究成果为智慧农业提供了重要的技术支撑,对应对气候变化、保障粮食安全具有积极意义。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号