高光谱成像结合遗传算法优化的机器学习方法,用于快速、无损地定量测定人参(Panax ginseng)中的人参皂苷和多糖成分

《Journal of Food Composition and Analysis》:Hyperspectral imaging combined with genetic algorithm-optimized machine learning for the rapid and nondestructive quantification of ginsenosides and polysaccharides in Panax ginseng

【字体: 时间:2025年11月19日 来源:Journal of Food Composition and Analysis 4.6

编辑推荐:

  人参皂苷和多糖同步检测及原产地鉴别的高光谱成像技术研究。采用双功能非破坏模型,结合极简学习机(ELM)和反向传播神经网络(BPNN)实现RS/RP定量预测,利用遗传算法(GA)优化特征波段选择,验证400-1005nm可见-近红外波段对两者检测更具优势。通过二阶导数预处理和粒子群优化算法,使原产地鉴别准确率达91.04%。研究建立"组件-波段-模型-特征"四维优化框架,为药用植物质量控制和地理标志保护提供新方法。

  本研究聚焦于一种高价值的药食两用植物——人参,通过引入一种创新的高光谱成像技术,开发出一种非破坏性的双功能检测模型,该模型不仅能够同时测量人参中的人参皂苷(RS)和多糖(RP)含量,还能够准确识别其地理来源。人参作为一种具有多种药理和营养功能的植物,其质量评估一直面临双重挑战:消费者通常将质量与地理来源挂钩,但科学证据表明,其药效主要取决于特定的活性成分,特别是人参皂苷和多糖。这种感知与实际质量之间的差异,使得人参行业在质量评估和消费者保护方面存在重大挑战。

传统的RS和RP检测方法,如紫外分光光度法、高效液相色谱法和质谱分析法,虽然在一定程度上能够实现成分的检测,但它们往往具有繁琐、耗时、人力密集等缺点,且需要专业技术人员和复杂的实验设备。此外,这些方法在检测过程中可能会对样品造成一定的破坏。因此,有必要建立一种可靠、低成本、准确、快速且非破坏性的检测技术,以满足大规模精准农业生产的需要。

高光谱成像(HSI)技术结合了光谱分析和成像的优势,能够生成每个像素点的光谱与空间信息的三维数据库,从而捕捉不同环境条件下人参的光谱差异,分析其独特的光谱特性与内部组织结构、营养成分和质量属性之间的关系。近年来,该技术在食品工业中得到了广泛应用。例如,Aqeel等人利用HSI系统对670个纯油和掺假油样本进行了分析,通过多种机器学习方法实现了100%的准确分类,为食品安全提供了可靠解决方案。Teixido–Orries等人则利用近红外高光谱成像(NIR–HSI)检测燕麦籽中的脱氧雪腐镰刀菌毒素(DON),通过部分最小二乘回归(PLSR)和四种分类方法进行分析,获得了最高预测精度的模型,以及77.8%的随机森林分类(RFC)准确率,验证了NIR–HSI检测的高潜力。

然而,当前的HSI研究仍存在一些关键局限,如模型与成分匹配的不足以及特征选择的不稳定性。许多研究在选择机器学习模型时,未系统考虑不同成分的光谱特性,例如人参皂苷(600-800 nm)的离散糖苷振动与多糖(1000-1100 nm)的宽泛羟基吸收之间的差异,以及VNIR(可见光近红外)与SWIR(短波红外)波段的光谱特性。这导致了模型选择的主观性,而像极端学习机(ELM)在峰值检测或BPNN在非线性关系建模方面的潜力尚未被充分探索。尽管遗传算法(GA)和投票策略被用于特征选择,但它们通常以静态方式应用,无法适应特定成分的光谱模式。

为解决上述问题,本研究提出了一种“成分-波段-模型-特征筛选”框架,实现了化学特性与分析方法之间的动态匹配。该框架独特地结合了GA迭代筛选(识别振动敏感波长)与共识投票(减少噪声),从而提高了特征选择的稳定性,实现了30%的提升。这种系统优于传统静态方法,能够适应成分的光谱特征。此外,本研究首次揭示了VNIR波段在RS和RP检测中的优越性,ELM在人参皂苷预测方面表现突出,而BPNN在多糖分析方面具有优势。我们对VNIR和SWIR波段在RS和RP预测中的敏感性进行了系统比较,评估了BPNN、ELM和决策树(DT)等算法的性能。创新的波长优化策略结合GA筛选和投票方法,以提高预测精度。为克服现场实施的挑战,我们还整合了主成分分析(PCA)降维方法与GA特征选择,同时采用环境光校正和SMOTE数据平衡技术,以确保系统的稳健性。

本研究在方法论上实现了三个关键突破:(1)构建了一种经过验证的非破坏性HSI模型,用于定量分析不同来源的人参中RS和RP含量;(2)通过自适应GA-投票系统,将特征选择稳定性提高了30%;(3)提供了关于VNIR波段在RS和RP检测中优越性的确凿证据。这些发现为食品制造商提供了可靠的原料筛选和质量控制工具,支持了高品质功能食品的开发。此外,本研究提出的框架也为其他药用植物的高光谱分析提供了可转移的范式,推动了非破坏性检测方法在植物化学研究中的发展。

在实验材料方面,本研究分析了120批3至5年生的人参样本,包括吉林(74批)、辽宁(17批)和黑龙江(29批)的样本。虽然总样本量满足初步高光谱研究的基本要求(通常为50至150个样本),但考虑到不同地区样本数量的不均衡可能对分析结果产生影响,我们采取了多项措施以确保研究的可靠性。首先,采样设计严格遵循实际生产比例,吉林占全国产量的60%以上,设计还涵盖了四种主要土壤类型和三种生长年份。其次,我们采用了SMOTE算法来平衡数据集,显著降低了每个类别F1分数的变异系数。最后,所有批次均进行了三次技术重复,以控制测量误差。经过100次蒙特卡洛交叉验证,模型表现出稳定的预测性能,准确率波动范围为±3%。尽管辽宁的样本数量相对较少,可能限制了该地区特定分析的精度,但总体的采样策略充分考虑了实际生产条件和研究方法的要求。

数据采集过程中,我们使用了一套高光谱成像系统,包括CCD、IMPERX 1920 × 1080 VIS NIR相机(Kowa镜头,焦距35 mm)、Kokusai 640 × 512 SWIR相机(AZURE镜头,焦距50 mm)、钨卤灯光源、可移除平台和计算机。为了消除光谱仪的影响并确保光源稳定性,实验前仪器进行了30分钟的预热。样品台与VNIR相机镜头保持固定距离(35±0.5 cm),与SWIR相机镜头保持40±0.5 cm。通过景深测试,确保了整个视野范围内空间分辨率达到0.3 mm/像素以下。人参样本(主根直径8-15 mm,长度50-80 mm)固定在旋转支架上,以45°倾斜角进行测量,使用软硅胶垫夹具以防止物理损伤和光谱异常。为了减少形态学变化对数据的影响,我们从三个不同的角度(0°/120°/240°旋转)采集每一样本的光谱数据,并排除了10%的边缘区域以避免表面反射干扰。此外,通过表面曲率校正算法补偿了由几何变形引起的光强梯度(校正系数κ=0.85-1.15)。系统使用标准参考板(Labsphere Spectralon?)进行了验证,其光谱反射率变异系数(CV)小于2.5%,满足了药用植物成像的精度要求。

在确定人参成分时,我们采用了两种方法。对于RS含量的测定,样品被粉碎并通过60目筛子筛分,以获取光谱信息。总RS含量通过香草醛-硫酸法测定。具体操作为:称取1克人参粉末,加入50 mL纯甲醇溶液(Fisher,美国),静置1小时后,用超声波提取0.5小时。随后,将提取液在7000 r/min下离心3分钟,取1 mL上清液与0.5 mL 8%香草醛溶液(上海优源生物科技有限公司)混合,再加入5 mL 72%浓硫酸(烟台双双化工有限公司),在水浴中于60 °C反应10分钟,冷却至室温后,在544 nm处测量吸光度。每个样本进行三次测量,计算平均值。人参皂苷Re(上海优源生物科技有限公司)被用作总RS含量的定量分析标准。

对于RP含量的测定,我们采用了苯酚-硫酸法。简要流程为:将1克人参粉末加入带塞三角烧瓶中,用蒸馏水稀释20倍,并在水浴中提取两次。合并滤液、滤渣和浓缩液后,加入无水乙醇(天津鑫通精细化学品有限公司)并在4 °C下冷藏4小时。随后,移除上清液,将0.5克人参粉末溶解于蒸馏水中。加入0.5 mL 6%苯酚溶液(天津天骄制药有限公司)和2.5 mL浓硫酸溶液(烟台双双化工有限公司),充分混合后,冷却30分钟至室温,并避免光照。在490 nm处测量吸光度,以葡萄糖(中国食品药品检定研究院)作为RP含量的定量分析标准。

在数据处理过程中,我们采用了多种方法。首先,使用ENVI 5.3软件手动提取感兴趣区域(ROI)。每一样本选择三个明亮且颜色协调的像素区域,并将其平均光谱作为后续分析的原始光谱数据。其次,通过主成分分析(PCA)进行降维处理,以减少光谱数据的冗余。PCA利用正交矩阵对原始光谱数据进行线性变换,生成低维矩阵,同时保留原始数据集中的大部分主要信息。这一过程不仅使数据更集中,缓解了维度灾难,还能有效减少噪声干扰。PCA被选为基准的线性降维方法,因其计算效率高、可解释性强,并在高光谱分析中被广泛采用,提供了常见的比较基准。此外,为了应对PCA等线性投影方法在捕捉特定光谱-成分关系方面的局限性,我们引入了基于遗传算法(GA)的特征选择策略。这种双策略框架允许对建立和优化的特征降维技术进行综合评估,以适应人参光谱数据的特定特性。

在特征波长筛选方面,我们采用了一种基于GA的特征波长筛选方法。GA是一种基于“适者生存”原理的全局优化算法,模拟生物进化机制,在机器学习和信号处理领域广泛应用。本研究使用了两种GA特征波长筛选方法,并进行了比较。第一种方法通过多次迭代确定最佳特征波长,第二种方法记录每次迭代中出现频率最高的特征波长。为了确保实验结果的可比性,两种方法筛选的特征波长数量保持一致。经过GA迭代筛选后,数据维度在RP和RS预测过程中显著降低。在VNIR波段,RS预测选择了125、38和17个波长,RP预测选择了135、47和27个波长。在SWIR波段,RS预测选择了224、119和43个波长,RP预测选择了238、113和42个波长。为了确保数据处理的一致性,GA筛选的特征波长数量与GA的最后几次迭代数量一致。特征波长的分布情况如图2所示。

在模型构建方面,我们对RS和RP预测分别采用了三种独立模型:BPNN、ELM和DT。BPNN包含输入层、隐藏层和输出层,通过误差BP算法调整权重以减少输出误差。ELM固定隐藏层的权重和偏差,专注于计算输出层的权重,通过求解线性方程或最小二乘法快速学习。DT作为非参数分类器,使用树状图进行决策,无需对数据做出假设。这些模型可以独立使用,也可相互验证,通过比较它们的预测性能,可以全面评估不同算法对光谱数据的适应性。

在人参来源识别方面,我们优先选择随机森林(RF)算法,该算法基于集成学习特性,能在预处理和特征筛选后提供优异的分类性能。同时,该算法内置的Bootstrap抽样机制与本研究采用的SMOTE数据平衡方法相结合,能有效缓解样本分布不均的问题。本研究的系统研究设计涵盖了多个模型和子目标,确保了每个模型的独立验证价值,并实现了方法论上的互补优势。

在模型评估方面,我们采用随机划分方法将数据集分为训练集和验证集,比例为9:1。光谱参数作为输入,RS和RP含量作为输出,使用R2和RMSE作为模型评估指标。R2的评价标准如下:R2 ≥ 0.9表示优秀性能;0.9 > R2 ≥ 0.8表示良好性能;0.8 > R2 ≥ 0.65表示合理性能;0.65 > R2 ≥ 0.50表示具有一定的预测能力;R2 ≤ 0.50表示缺乏预测能力。随着R2值接近1,RMSE下降,表明模型拟合度更高,预测准确性更强。为了提高模型的泛化能力和鲁棒性,我们采用了五折交叉验证方法。

在结果分析方面,人参皂苷和多糖含量的预测性能在不同波段表现各异。对于RS预测,ELM–RAW模型在VNIR和SWIR波段均表现出最佳预测性能。在VNIR波段,该模型的验证集R2值(Rv2 = 0.86)和训练集R2值(Rt2 = 0.86)均优于BP–RAW(Rv2 = 0.73,Rt2 = 0.89)和DT–RAW(Rv2 = 0.76,Rt2 = 0.83)模型,同时保持最低的RMSE值(0.2924)。这种优势在SWIR波段也得到了保留(Rv2 = 0.72,Rt2 = 0.82)。对于RP预测,BP–RAW模型在两个波段均表现出最佳性能。在VNIR波段,其验证集和训练集的R2值分别为0.68和0.84,而SWIR波段的相应指标分别为0.77和0.84。值得注意的是,DT模型在SWIR波段的RP预测中表现出显著的过拟合现象(Rt2 = 1.00,但Rv2 = 0.41)。BPNN模型的优势在于其隐藏层的非线性激活函数更适合处理RP分子中复杂的O–H/C–H组合振动模式。与DT–RAW相比,BPNN通过误差反向传播调整权重,能更好地处理光谱数据中的非线性关系,这在VNIR波段的RP预测中尤为明显,RMSE降低了42%。

通过比较两个波段的性能,我们发现VNIR波段在预测性能上优于SWIR波段。对于RS预测,ELM–GA3模型在SWIR波段的Rv2值为0.82,而VNIR波段的BP–GA3模型Rv2值为0.78,Rt2值为0.99,同时RMSE值显著降低。这表明,PCA在某些情况下可以有效减少噪声和冗余特征,但在其他情况下可能损害关键的光谱特征。例如,ELM和DT模型在VNIR波段的RS预测中表现下降,SWIR波段的模型信息丢失,RP的解释能力下降。这种选择性效果源于三个因素:BPNN的自适应权重调整机制可以容忍PCA引起的光谱扰动,而ELM的固定权重架构放大了特征损失,RP的广泛光谱特征需要连续的波长保留,而PCA会破坏这一过程;此外,VNIR的信噪比更高,有利于有效的噪声减少,而SWIR的重叠噪声-信号光谱会导致无差别地去除关键特征。这些发现表明,当与预处理结合时,PCA可能适用于具有离散光谱峰的成分(如RS),而具有连续宽带特征的成分(如RP)可能更受益于其他方法,如波长聚类。

在特征波长筛选方面,原始高光谱数据具有大量波段,高维且高度冗余,这增加了计算复杂性并干扰了模型性能。因此,我们使用GA筛选原始光谱以识别特征波长,并比较了GA的迭代和投票方程。经过GA迭代筛选后,数据维度在RP和RS预测过程中显著降低。在VNIR波段,RS预测选择了125、38和17个波长,RP预测选择了135、47和27个波长。在SWIR波段,RS预测选择了224、119和43个波长,RP预测选择了238、113和42个波长。为了确保数据处理的一致性,GA投票中选择的特征波长数量与GA的最后几次迭代数量一致。特征波长的分布情况如图2所示。

根据表1,BP–GA3模型在VNIR波段的RS预测中表现出最佳整体性能。该模型的RS预测准确率在验证集(Rv2 = 0.78)和训练集(Rt2 = 0.99)均显著优于其他模型,同时RMSE值保持较低。值得注意的是,在GA优化过程中,BP–GA3表现出与BP–GA1(Rt2 = 0.94)和BP–GA2(Rt2 = 0.98)相似的迭代优化,而BP–GA-vote(Rt2 = 0.85)尽管具有更高的稳定性,但其准确率有所下降。

在RP预测中,DT–RAW模型在VNIR波段表现出优越性,其验证集和训练集的R2值分别为1.00和1.00,表明该模型在预测RP时具有较高的准确率,尽管可能有过度拟合的情况。此外,尽管GA优化的版本(如DT–GA1、DT–GA2、DT–GA3)在准确率上有所提升,但其性能仍无法超越原始模型。这一现象表明,对于某些特定成分的预测,原始模型可能已经达到了其性能极限,GA的迭代优化在提升预测性能方面存在局限性。

总体而言,VNIR波段在预测性能上优于SWIR波段。在RS预测中,尽管ELM–GA3模型在SWIR波段的Rt2值达到了1.00,但其Rv2值(0.82)和RMSE值仍不如VNIR波段的BP–GA3模型。在RP预测中,VNIR波段的DT–RAW模型(Rt2 = 1.00)也显著优于SWIR波段的BP–GA3模型(Rt2 = 0.96)。这表明,VNIR波段包含更多的分子振动乘积和组合信息,而SWIR波段容易受到水吸收干扰,降低信噪比。

PCA被用于降维处理,虽然能有效减少冗余,但其线性投影可能丢失与目标相关性较弱的信号,尤其是在多糖等复杂特征的情况下,可能会损害模型性能。为解决这一问题,我们引入了基于GA的特征选择策略,该策略直接保留具有生理意义的波长,增强模型的可解释性,并提高模型稳定性。对于优先考虑特征保留的场景,如光谱可视化,非线性方法如t-SNE仍具有相关性。我们建议采用分层方法:PCA用于基础降维,GA用于针对性量化,t-SNE用于探索性分析。定制化的算法选择对于确保药用植物和食品产品的质量评估和产品开发的准确性至关重要。

在特征波长筛选方面,GA迭代筛选在构建模型和提高预测准确性方面比投票策略更准确。来源识别研究显示,原始数据的SWIR波段在测试集的准确率(0.7463)和F1值(0.7422)略高于VNIR波段(0.7164和0.7081),这可能是因为SWIR波段的光谱范围对应某些特定化学键的基频振动。然而,经过预处理后,VNIR波段的性能显著提高,测试集的准确率达到0.8955,提高了25%。同时,SWIR波段的准确率提高到0.9104,提高了21.9%。这表明,VNIR波段包含更多可以通过预处理提取的有效信息,其性能更接近SWIR波段。优化后的VNIR波段性能与SWIR波段相似,尽管训练集的准确率和F1值达到了1.0000,但在测试集上仍存在一定的性能差距,这表明模型可能存在过拟合问题。在未来的研究中,需要采用更严格的数据划分(如KS划分)或引入正则化技术,以限制模型并防止其过拟合训练数据中的噪声和局部特征。

在特征波长选择方面,PSO+SDR组合在VNIR波段表现最佳,测试集的准确率(0.9104)和F1值均比单独的SDR处理提高了1.7%。这一现象是因为VNIR波段主要包含分子振动的八度和组合频率信息,这种复杂的信号结构特别适合智能优化算法如PSO进行特征选择,能够有效识别这些潜在特征,并通过模拟鸟群的觅食行为在复杂空间中找到最佳波长组合。而SWIR波段主要包含分子振动的基频信息,信号特征相对清晰和直接。单独的SDR预处理在SWIR波段表现最佳,准确率和F1值分别为0.9104和0.9086,比PSO+SDR组合提高了11.5%。这表明,由于SWIR波段的信号结构较为清晰,过度的智能优化可能会导致有效信息的丢失。因此,单独的SDR处理能够有效增强SWIR光谱的特征峰,抑制基线漂移,从而达到最佳效果。

在食品工业应用方面,高光谱技术在人参饮料和保健品的生产线上展现出广阔的应用前景。该技术已被深度整合到食品工程的整个过程中,为产品健康功能的精准实现提供技术支撑。在原料预处理阶段,通过分析人参原料的光谱特性,高光谱技术可以快速评估其营养矩阵的状态,如蛋白质和膳食纤维含量,并结合水分活度测试数据,精确调整干燥温度。在浓缩过程中,高光谱技术可以对人参提取物的光谱指纹进行实时监测,动态跟踪热敏性活性成分(如RS和RP)的热稳定性,帮助优化浓缩过程曲线,使热敏性成分的保留率超过90%。在混合过程中,高光谱方法可以直观评估辅料和人参提取物的混合均匀度,确保人参总RS含量的误差在±2%以内,满足食品工程的标准化要求。

从健康功能的角度来看,高光谱技术能够精准识别具有抗肿瘤和抗疲劳功效的人参皂苷成分,为产品健康声明提供定量依据。同时,HSI系统可以快速筛查人参健康产品的微生物污染,缩短传统的检测周期,通过识别菌落特异性光谱吸收峰,有效避免微生物过载带来的健康风险。通过光谱数据监测氧化指标,可以科学预测产品储存过程中抗氧化活性的下降,为建立产品保质期提供数据支持。此外,高光谱技术积累的大量光谱数据库有助于探索人参原料与健康功能之间的潜在相关性,推动功能性成分的定向开发,实现从传统补益到精准健康干预的产业升级。

然而,将本研究的成果应用于食品行业仍面临挑战。当前使用的HSI设备成本较高,一套专业的高光谱成像系统通常需要50万至150万元,这对许多中小型企业来说意味着较大的前期投资和运营成本压力,使其难以负担该技术。此外,环境光的稳定性问题也是其大规模应用的严重限制,因为不同生产环境下的光强可能从数百到数千勒克斯不等,光谱分布也存在显著差异,这导致检测结果的准确性难以保证,检测稳定性较低。因此,本研究的样本量和模型适应性仍需进一步优化,人参在不同生长年份和不同栽培方法下的检测结果存在差异,而食品生产的人参生长条件复杂多样。在未来的研究中,应增加样本量,涵盖不同生长年份和栽培方法的人参样本,进一步研究它们对光谱特性和模型检测结果的影响,以优化检测模型,提高模型的适应性和准确性,从而更好地支持食品行业的质量控制和产品开发。

本研究的结论表明,通过高光谱成像技术,可以同时实现人参皂苷和多糖的非破坏性定量分析,并识别其地理来源。这突破了传统地理来源单一识别的局限性,为食品企业提供了可靠的质量控制工具。研究还发现,人参在不同地区的含量存在显著差异,例如,吉林人参的平均RS含量为1.69%,辽宁和黑龙江的人参RS含量分别为1.61%和1.42%,而黑龙江人参的平均RP含量为14.24%,高于吉林(12.51%)和辽宁(13.14%)的人参。这种差异可能与三省的气候、土壤条件和栽培方法密切相关。吉林省位于温带季风气候区,具有良好的光照、温度和降水条件,土壤富含多种矿物质,为RS合成所需的酶提供了适宜的环境,从而促进了RS的合成和积累。相比之下,黑龙江省的气候相对寒冷,昼夜温差较大,这可能影响人参的代谢途径,使RP的合成更加活跃,从而有利于RP的积累。这一发现为食品企业准确选择人参原料提供了坚实的依据。

在特征波长筛选过程中,GA迭代筛选比投票策略更准确,能够构建更精确的模型并提高预测准确性。来源识别研究显示,经过预处理后,两个波段的性能均有所提升。例如,VNIR波段在SDR预处理后,测试集的准确率达到0.8955,提高了25%。同时,SWIR波段的准确率提高到0.9104,提高了21.9%。这表明,VNIR波段包含更多可以通过预处理提取的有效信息,其性能更接近SWIR波段。优化后的VNIR波段性能与SWIR波段相似,尽管训练集的准确率和F1值达到了1.0000,但在测试集上仍存在一定的性能差距,这表明模型可能存在过拟合问题。在未来的研究中,需要采用更严格的数据划分(如KS划分)或引入正则化技术,以限制模型并防止其过拟合训练数据中的噪声和局部特征。

在特征波长选择方面,PSO+SDR组合在VNIR波段表现最佳,测试集的准确率和F1值均达到了0.9104,比单独的SDR处理提高了1.7%。这一现象是由于VNIR波段主要包含分子振动的八度和组合频率信息,这种复杂的信号结构特别适合智能优化算法如PSO进行特征选择,能够有效识别这些潜在特征,并通过模拟鸟群的觅食行为在复杂空间中找到最佳波长组合。而SWIR波段主要包含分子振动的基频信息,信号特征相对清晰和直接。单独的SDR预处理在SWIR波段表现最佳,准确率和F1值分别为0.9104和0.9086,比PSO+SDR组合提高了11.5%。这表明,由于SWIR波段的信号结构较为清晰,过度的智能优化可能会导致有效信息的丢失。因此,单独的SDR处理能够有效增强SWIR光谱的特征峰,抑制基线漂移,从而达到最佳效果。

在食品工业应用方面,高光谱技术在人参饮料和保健品的生产线上展现出广阔的应用前景。该技术已被深度整合到食品工程的整个过程中,为产品健康功能的精准实现提供技术支撑。在原料预处理阶段,通过分析人参原料的光谱特性,高光谱技术可以快速评估其营养矩阵的状态,如蛋白质和膳食纤维含量,并结合水分活度测试数据,精确调整干燥温度。在浓缩过程中,高光谱技术可以对人参提取物的光谱指纹进行实时监测,动态跟踪热敏性活性成分(如RS和RP)的热稳定性,帮助优化浓缩过程曲线,使热敏性成分的保留率超过90%。在混合过程中,高光谱方法可以直观评估辅料和人参提取物的混合均匀度,确保人参总RS含量的误差在±2%以内,满足食品工程的标准化要求。

从健康功能的角度来看,高光谱技术能够精准识别具有抗肿瘤和抗疲劳功效的人参皂苷成分,为产品健康声明提供定量依据。同时,HSI系统可以快速筛查人参健康产品的微生物污染,缩短传统的检测周期,通过识别菌落特异性光谱吸收峰,有效避免微生物过载带来的健康风险。通过光谱数据监测氧化指标,可以科学预测产品储存过程中抗氧化活性的下降,为建立产品保质期提供数据支持。此外,高光谱技术积累的大量光谱数据库有助于探索人参原料与健康功能之间的潜在相关性,推动功能性成分的定向开发,实现从传统补益到精准健康干预的产业升级。

然而,将本研究的成果应用于食品行业仍面临挑战。当前使用的HSI设备成本较高,一套专业的高光谱成像系统通常需要50万至150万元,这对许多中小型企业来说意味着较大的前期投资和运营成本压力,使其难以负担该技术。此外,环境光的稳定性问题也是其大规模应用的严重限制,因为不同生产环境下的光强可能从数百到数千勒克斯不等,光谱分布也存在显著差异,这导致检测结果的准确性难以保证,检测稳定性较低。因此,本研究的样本量和模型适应性仍需进一步优化,人参在不同生长年份和不同栽培方法下的检测结果存在差异,而食品生产的人参生长条件复杂多样。在未来的研究中,应增加样本量,涵盖不同生长年份和栽培方法的人参样本,进一步研究它们对光谱特性和模型检测结果的影响,以优化检测模型,提高模型的适应性和准确性,从而更好地支持食品行业的质量控制和产品开发。

综上所述,本研究提出了一种结合成分特异性机器学习的高光谱成像模型,能够同时实现人参皂苷和多糖的非破坏性定量分析以及来源识别。这突破了传统仅依赖地理来源的局限性,为食品企业提供了更加精准的质量控制工具。研究还发现,人参在不同地区的成分存在显著差异,如吉林人参的RS含量最高,黑龙江人参的RP含量最高,这些差异为食品生产供应链提供了重要的依据。此外,通过结合食品加工过程,检测流程可以进一步优化,推动非破坏性检测技术(NDT)在食品行业的广泛应用,并全面提升功能性食品的质量控制水平。
相关新闻
生物通微信公众号
微信
新浪微博
  • 急聘职位
  • 高薪职位

知名企业招聘

热点排行

    今日动态 | 人才市场 | 新技术专栏 | 中国科学人 | 云展台 | BioHot | 云讲堂直播 | 会展中心 | 特价专栏 | 技术快讯 | 免费试用

    版权所有 生物通

    Copyright© eBiotrade.com, All Rights Reserved

    联系信箱:

    粤ICP备09063491号