FISH-SPEC:一种用于手持光谱仪的快速识别系统及物种分类工具
《Applied Food Research》:FISH-SPEC: Fast Identification System for Handheld Spectroscopy and Species Classification
【字体:
大
中
小
】
时间:2025年11月23日
来源:Applied Food Research 6.2
编辑推荐:
本研究开发了一种手持式多模式点光谱系统,结合365nm和395nm荧光以及可见光至近红外和短波红外反射光谱,通过特征级融合和争议模型技术实现鱼类物种的快速非破坏性识别。实验表明,解冻样本分类准确率达93%,冷冻样本达90%,融合数据较单一模式提升5%-10%,有效解决了渔业欺诈问题。
在当今全球化的食品供应链中,准确识别鱼类种类对于防止欺诈行为、保障食品安全以及维护生态环境至关重要。本研究介绍了一种便携式多模式点光谱系统,结合了荧光和反射光谱测量技术,可在可见光至近红外(约350–900纳米)以及短波红外(约900–1700纳米)范围内快速、无损地对鱼片进行分类。这种系统为现场检测鱼类欺诈提供了高效、可靠的技术手段,尤其适用于无法通过肉眼识别的鱼片和部分处理后的鱼肉。
### 问题的严重性
鱼类标签错误在食品行业是一个普遍存在的问题,且影响深远。非营利组织Oceana的一项大规模调查发现,全球55个国家的鱼类供应环节中,有19%的鱼类被错误地标记为其他种类。这种欺诈行为不仅对消费者健康构成威胁,还可能导致摄入过敏原、毒素、重金属、抗生素残留等有害物质,引发严重的食物中毒甚至危及生命。此外,标签错误还可能误导消费者对鱼源地的认知,造成经济上的不公平竞争,损害合法捕捞者和供应商的利益。更严重的是,这种现象还可能破坏渔业资源的可持续管理,导致某些脆弱物种过度捕捞,进而影响海洋生态平衡。
### 现有技术的局限性
为了应对这些问题,传统方法如视觉检查、DNA条形码和实时聚合酶链式反应(PCR)已被广泛应用。然而,这些方法各有局限。视觉检查依赖于专业人员的经验,且在某些情况下难以识别具有相似外观的鱼种。DNA条形码虽然准确,但需要实验室分析,耗时较长,且成本较高。而实时PCR虽然具有便携性和快速性,但仅能检测特定种类,无法全面识别多种鱼类。因此,开发一种快速、无损且适用于现场检测的鱼类识别系统显得尤为重要。
### 多模式光谱技术的优势
光谱技术作为一种便携、无损的检测手段,近年来在鱼类识别领域取得了显著进展。其优势在于无需高度专业化的人员操作,且能够在几秒钟内获得结果,甚至可以穿透包装材料如塑料膜,对样品进行分析。然而,光谱技术在鱼类识别中的应用仍面临挑战,例如如何有效区分光谱相似的鱼类种类。为了解决这一问题,本研究团队开发了一种手持式多模式点光谱设备,结合了两种荧光模式(365纳米和395纳米激发波长)以及可见光和短波红外反射光谱模式,以获取多种独立的生化和结构特征,从而提高分类准确性。
### 实验设计与数据采集
本研究采集了68个鱼片样本,涵盖11种鱼类,每种至少有三个样本。样本均来自一家可信赖的在线海鲜商店,初始为冷冻状态,随后在?20°C条件下储存。实验过程中,鱼片被放置在样品夹中,设备被固定在上方以确保测量距离的一致性。为了适应鱼片的局部厚度变化,设备的安装高度在测量过程中被调整。在每种光谱模式下,从鱼片的25个位置采集数据,分别记录了冷冻和解冻后的样本,以评估不同状态下的识别效果。
### 数据预处理与特征融合
在数据采集后,首先对数据进行了质量评估,剔除了饱和和噪声较高的光谱。为了校准样本测量,还采集了白色和黑色参考样本。随后,对每种光谱模式进行了最小-最大归一化处理,以确保数据在0–1范围内。在进行特征融合前,所有光谱数据被插值以实现波长对齐。最终,将四种模式(365纳米荧光、395纳米荧光、可见光反射和短波红外反射)的归一化光谱数据沿特征轴连接,形成单一的多模式特征向量,用于后续的机器学习模型训练。
### 机器学习模型与分类方法
本研究采用了一种基于主成分分析(PCA)和线性判别分析(LDA)的机器学习框架,以提高分类效率和准确性。PCA用于降维,提取最具代表性的主成分,而LDA则用于投影数据到一个更低维的空间,最大化类间可分性。该框架在多个光谱模式上表现优异,特别是在处理具有大量相关特征的光谱数据时,能够有效减少冗余并提升计算效率。此外,为了提高分类性能,研究团队还引入了一种分层的争议模型框架,专门针对那些在全局模型中表现不佳的鱼类种类进行优化。
### 争议模型的构建与应用
在构建争议模型时,研究团队首先对全局模型的分类结果进行了评估,并通过混淆矩阵识别出分类性能低于80%的鱼类种类。这些种类被归为“形成物种”,并与其他常被误分类的物种组成争议模型。争议模型通过单独训练,进一步提高了对这些物种的识别准确率。例如,在解冻数据集中,Rockfish、Lingcod和Pacific Cod常常被误分类,因此被纳入争议模型。该模型在识别这些鱼类时表现出显著的提升,将整体准确率从90%提高到93%。争议模型的预测结果会覆盖全局模型的决策,以提高分类的可靠性。
### 分类结果与模型评估
实验结果显示,全局模型在融合数据集上的准确率为85%±2.8%,在解冻数据集上达到90%±6.0%,而在冷冻数据集上为90%±5.4%。争议模型的应用进一步提升了解冻数据集的准确率至93%±4.3%。此外,研究团队还对模型进行了交叉验证,以确保其在不同数据集上的泛化能力。交叉验证结果显示,模型在不同状态下的分类性能存在显著差异,说明解冻和冷冻鱼片的光谱特征存在明显区别。因此,建议为不同状态的鱼片分别开发模型,或采用统一模型,以涵盖冷冻和解冻状态的样本。
### 争议模型的优化效果
通过引入争议模型,研究团队对模型性能进行了进一步优化。争议模型特别针对光谱相似的鱼类种类,提高了它们的识别准确率。例如,在解冻数据集上,Rockfish、Lingcod和Pacific Cod的分类准确率得到了显著提升。此外,争议模型的使用还增强了模型的稳定性,使其在面对样本多样性时表现更加出色。实验结果表明,争议模型在解冻数据集上的效果优于冷冻数据集,这可能是由于解冻鱼片在光谱特征上表现出更多的多样性。
### 光谱特征的分析与应用
为了进一步理解不同光谱模式的贡献,研究团队进行了互信息(MI)分析。该分析显示,365纳米和395纳米的荧光模式在数据中具有较高的冗余度,而可见光和短波红外反射光谱模式则提供了更多的互补信息。这意味着单独使用荧光模式可以达到较高的分类准确率,而结合所有模式的特征融合则在提升分类效果方面具有额外价值。尽管如此,研究团队仍然认为,通过降维和分类框架(如PCA和LDA)可以有效减少冗余,提高模型的泛化能力。
### 模型的稳定性与泛化能力
为了验证模型的泛化能力,研究团队对模型进行了随机标签打乱实验。结果显示,当标签被随机打乱后,模型的分类准确率低于15%,表明模型并未出现过拟合现象,而是真正学习到了数据与鱼类种类之间的关系。这一结果进一步证明了模型的有效性。此外,通过非参数的Wilcoxon符号秩检验和Bonferroni校正,研究团队评估了不同数据集之间的分类性能差异。结果显示,尽管冷冻和解冻数据集在分类性能上没有显著差异,但当模型在一个状态下训练并在另一个状态下测试时,性能出现了显著下降。这表明,光谱特征在冷冻和解冻状态下存在显著差异,因此需要分别处理。
### 实际应用的考虑
尽管本研究的成果展示了多模式光谱技术在鱼类识别方面的潜力,但实际应用中仍需考虑多个因素。例如,光谱采集过程中需要确保测量的一致性,同时还需要处理不同环境下的光照变化。目前,实验数据均在实验室环境下采集,未在实际市场或户外环境中进行测试,这可能影响模型的实用性。因此,未来的研究将关注于在实际场景中验证系统的性能,以确保其在各种环境条件下的稳定性。
### 结论与展望
本研究开发了一种手持式多模式点光谱设备,并结合了机器学习算法,实现了对多种鱼类的快速、无损识别。实验结果表明,该设备在不同状态下均能提供可靠的分类性能,特别是在解冻状态下,争议模型的应用显著提高了识别准确率。这一技术为解决鱼类标签错误问题提供了新的解决方案,有助于提升食品供应链的透明度和安全性。未来,研究团队计划扩展数据集,涵盖更多种类的鱼类,并进一步优化模型以适应实际应用环境。此外,研究还将探索如何在不同的光照条件下提高模型的稳定性,以确保其在真实世界中的广泛应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号