《Journal of Food Composition and Analysis》:Rapid and Non-Destructive Origin Authentication of Goji Berries Using Raman Spectroscopy and a Lightweight Deep Learning Framework
编辑推荐:
枸杞地理溯源的Raman光谱轻量化智能识别研究,通过BGS-DenseNet模型融合光谱特征与深度学习优化,实现99.65%的高精度非破坏性检测,为中药材质量控制和溯源提供高效解决方案
杨志清|陈敏|高淑敏|吴荣轩|张浩凡|张梦雅|杨宇|秦瑶|李鹏
河南工业大学信息科学与工程学院,郑州450001,中国
摘要
枸杞(Lycium barbarum)因其治疗和营养价值而广受认可,但其化学成分和功效因地理来源的不同而有显著差异。确保其真实性对于质量控制和防止掺假至关重要。在这项研究中,通过将拉曼光谱与优化的轻量级深度学习模型BGS-DenseNet相结合,开发了一种快速且无损的识别方法。该框架在保持低计算成本的同时,增强了光谱特征提取和融合能力。使用来自多个地区的样本进行的实验表明,所提出的模型达到了99.65%的分类准确率,优于传统的机器学习和标准卷积神经网络。由于其高效性和易于部署的特点,该方法非常适合用于草本和农产品的实时、现场来源追踪。本研究为传统中药和食品安全管理的可追溯性提供了一个可扩展且智能的解决方案。
引言
枸杞是一种具有营养和药用价值的传统中药。其果实、果皮和叶子长期以来被用于临床和饮食领域(Jiang等人,2024年;Yu等人,2023年)。然而,不同地理来源的枸杞在化学成分上存在显著差异(Ju等人,2025年)。其中,宁夏产的枸杞因其高含量的生物活性成分而特别受重视(Ma等人,2023年;Wang等人,2019年)。鉴于枸杞在各种食品应用中的广泛使用,建立快速、无损且准确的来源追踪方法对于确保产品真实性和维护消费者信任至关重要。然而,现有的手动识别方法具有主观性和不一致性(Yao等人,2018年)。尽管高效液相色谱(HPLC)和稳定同位素分析等化学分析方法能够提供准确的结果,但它们耗时、成本高昂且具有破坏性(Bertoldi等人,2019年)。
基于分子振动散射的拉曼光谱技术提供了快速、无损的化学结构和成分分析方法。它已广泛应用于食品和草药的质量控制(Sun等人,2022年;Wang等人,2023年)。近年来,与传统的机器学习方法(如SVM(Wen等人,2025年)、RF(Yang等人,2025年)和KNN(Kim等人,2024年)相比,基于深度学习的光谱分类方法(如AlexNet(Wu等人,2024年)和ResNet50(Kang等人,2025年)通过自动特征提取显著提高了准确率。然而,这些模型通常需要大量的标记数据和大量的计算资源,这增加了模型的复杂性和部署成本(Rather等人,2024年)。为了平衡分类性能和推理效率,最近的研究主要集中在设计轻量级网络架构上,如MnasNet(Tan等人,2019年)和MobileNet(Chen等人,2025年)。在拉曼光谱任务中,Zhou等人提出了RamanNet,这是一种用于细菌识别的简化卷积架构。虽然实现了轻量化设计并达到了96.04%的准确率,但该模型存在特征碎片化和有限的上下文建模能力(Zhou等人,2022年)。Gong等人引入了RamanCMP,将轻量级深度学习模型与知识蒸馏和通道转换策略相结合,以实现高效的模型压缩。然而,过度简化削弱了特征表示能力,导致准确率仅为94.48%(Gong等人,2023年)。Qiu等人结合了ShuffleNet和表面增强拉曼光谱(SERS)来检测多环芳烃(PAH)残留物,准确率达到97.63%。然而,SERS样品制备的严格实验要求限制了其实际应用(Qiu等人,2023年)。He等人提出了RepDwNet,结合了多尺度卷积和重新参数化来平衡血液样本分类的速度和准确性。然而,其在建模局部-全局光谱相关性方面的能力仍然有限(He等人,2024年)。Mahmud等人开发了SuperRaman,集成了非线性激活和可变形卷积来增强局部特征响应。然而,其有限的感受野限制了模型捕捉长距离光谱依赖性的能力(Mahmud等人,2025年)。对于枸杞等药用草本的地理来源识别,不同地区的拉曼光谱差异较为微妙——主要体现在特定功能团振动峰的强度和位置变化上。这给细粒度特征提取和模型鲁棒性带来了更大的挑战(Kalatzis等人,2025年)。现有的深度学习模型在应用于枸杞来源追踪时,在泛化性能和分类准确性方面仍有改进空间。
为了解决上述挑战,本研究提出了改进的识别模型BGS-DenseNet。该模型以DenseNet-121为基础,利用特征重用和Squeeze-and-Excitation(SE)注意力机制来自动提取关键光谱特征,有效捕捉局部峰特征和长距离依赖性。此外,通过结构化剪枝和优化的卷积操作,消除了冗余神经元,从而实现了轻量级架构,提高了枸杞地理来源识别的分类准确率和泛化能力。
部分内容
枸杞样本
为了确保地理来源是唯一的影响因素,实验使用了相同品种、大小和颜色的枸杞样本。共获得了750个枸杞样本,这些样本来自河南省郑州市的张仲景制药有限公司,并在4°C下密封保存以减少环境干扰。这些样本来自中国的五个主要生产区域:甘肃的临夏(GS)、内蒙古的巴彦淖尔(NMG)
枸杞拉曼光谱特征分析
枸杞的拉曼光谱揭示了其复杂的分子组成,主要包括黄酮类、多酚类和类胡萝卜素等生物活性化合物(Shi等人,2025年)。图4展示了来自五个不同生产区域的枸杞样本的平均拉曼光谱曲线。主要特征峰分别位于990?cm-1、1147?cm-1和1526?cm-1,分别对应于甲基集团(-CH?)的变形振动、C-C键的伸缩振动
结论
基于拉曼光谱技术,开发了一种改进的深度神经网络模型BGS-DenseNet,用于识别枸杞的来源。该模型在保持轻量级架构和计算效率的同时,实现了高分类准确率。自动化和无损分类的实现表明其在实际应用中具有巨大潜力,有助于推动传统中药实践的现代化
作者贡献声明
李鹏:撰写 – 审稿与编辑,监督,概念构思。秦瑶:研究。高淑敏:撰写 – 审稿与编辑,撰写 – 原稿,研究,概念构思。陈敏:撰写 – 原稿,数据管理。杨志清:撰写 – 审稿与编辑,撰写 – 原稿,数据管理。杨宇:研究。张梦雅:研究,概念构思。张浩凡:可视化。吴荣轩:研究,形式分析。
利益冲突声明
作者声明他们没有已知的可能会影响本文工作的竞争性财务利益或个人关系。
致谢
本研究部分得到了中国国家自然科学基金(项目编号62401199和62373136)、河南工业大学复杂性科学研究所的开放项目(项目编号CSKFJJ-2024-24、CSKFJJ-2025-45、CSYJSKFJJ-2024-64和CSKFJJ-2025-46)、河南工业大学的研究启动基金(项目编号2024BS085/0004/31401731)以及河南省科技研究项目的支持。