利用优化校准模型进行近红外光谱预测木薯中的干物质和淀粉含量
《JOURNAL OF FOOD SCIENCE》:Near-Infrared Spectroscopy Prediction of Dry Matter and Starch Content in Cassava Using Optimized Calibration Models
【字体:
大
中
小
】
时间:2025年11月23日
来源:JOURNAL OF FOOD SCIENCE 3.4
编辑推荐:
干物质含量和淀粉含量是木薯育种的关键质量性状,传统方法耗时且难以规模化。本研究开发了基于近红外光谱(NIR)的预测模型,对比了台式(NIR.N500)和便携式(NIR.QST)设备,并评估了样本处理(新鲜与压碎)的影响。结果表明,压碎样本在两种设备上均提升预测精度,其中台式设备的PLS模型表现最佳(StC R2=0.89,DMCg R2=0.39),便携式设备在压碎样本下也能达到较高准确性(StC R2=0.88,DMCg R2=0.74)。样本处理显著影响模型性能,压碎样本减少内部异质性,提升光谱预测效果。外部验证显示,便携式设备在压碎样本下的性能接近台式设备,且具有现场快速检测的优势。PLS模型整体性能最佳,XGB次之,KNN最差。本研究证实,NIR结合压碎样本处理可高效预测木薯关键性状,便携设备为规模化育种提供实用工具。
### 椰子研究:近红外光谱技术在甘薯育种中的应用
在甘薯(*Manihot esculenta*)育种过程中,干物质含量(DMC)和淀粉含量(StC)是关键的质量性状。这些性状不仅影响甘薯的加工效率,还直接决定了其商业价值。然而,传统的表型分析方法往往耗时且难以大规模应用,这成为育种工作的一大瓶颈。因此,研究如何利用快速、准确且可扩展的技术手段来评估这些性状具有重要的现实意义。
近红外光谱(NIR)作为一种非破坏性技术,近年来在农业领域得到广泛应用。NIR通过测量物质对近红外光的吸收和反射特性,能够快速预测多种生物化学性状。在甘薯育种中,NIR技术已被用于评估烹饪时间、类胡萝卜素含量和氰化物潜力等性状。但不同设备和模型对DMC和StC的预测效果存在差异,尤其是在不同样本类型(新鲜与加工)和环境条件下,设备性能也会受到一定影响。
本研究旨在开发和验证基于NIR的预测模型,以评估巴西甘薯种质资源中DMC和StC的性状,并比较两种设备——桌面型(Büchi NIRFlex N-500)和便携型(QualitySpec Trek)在预测性能上的差异。此外,还评估了样本类型对模型准确率的影响。研究覆盖了从2018年至2023年间,巴西巴伊亚州的50个田间试验,共涉及3,391个甘薯克隆。这些克隆来自多个育种阶段,包括克隆评价试验(CET)、初步产量试验(PYT)、先进产量试验(AYT)、统一产量试验(UYT)以及未改良的种质资源(BAG)。通过使用传统的重力分析(DMCg)、烘箱干燥(DMCo)和手工提取淀粉含量(StC)作为参考值,研究进一步利用NIR光谱数据,构建和验证多种预测模型,包括偏最小二乘法(PLS)、k-最近邻算法(KNN)和极端梯度提升(XGB)。
研究结果表明,PLS模型在所有性状和设备中均表现出最高的预测准确性。KNN模型在某些特定情况下,如使用桌面型设备进行DMCg预测时,略优于PLS。而XGB模型在部分场景下与PLS表现相当,例如在桌面型设备预测StC时,XGB的预测准确率为0.88,与PLS的0.89相近。值得注意的是,加工后的样本在模型预测中表现优于新鲜样本,尤其是便携式设备(NIR.QST)在处理加工样本时显示出更高的预测性能。在外部验证中,NIR.QST在预测DMCg和StC时,甚至超过了桌面型设备的表现。
### 实验材料与方法
本研究使用的甘薯克隆来自巴西Embrapa Mandioca e Fruticultura育种计划,涵盖多个不同的育种阶段和实验地点。实验地点分布在巴伊亚州的15个试验点,具有热带气候特征,年平均降雨量为1,170毫米,年平均温度约为25°C。为了确保实验的代表性,研究者在多个试验中采集样本,并对样本进行处理,包括清洗、切割和均质化。最终,每个样本被分为三种类型:中央区域、近端区域和远端区域,以分析甘薯根部沿轴向的纵向差异。
实验过程中,研究团队使用了两种NIR设备:桌面型Büchi NIRFlex N-500(NIR.N500)和便携式QualitySpec Trek(NIR.QST)。NIR.N500的波长范围为1000–2500 nm,分辨率较高,能够提供更精确的光谱数据。而NIR.QST的波长范围更广,覆盖350–2500 nm,其分辨率在1400 nm处为9.8 nm,适合现场快速检测。为了减少光散射的影响,光谱数据经过了Savitzky-Golay(SG)滤波、间隙段导数和标准正态变量(SNV)等预处理步骤,以提高模型的稳健性和预测准确性。
在模型构建过程中,研究团队采用了一种混合模型,用于估计不同波长下的遗传力。该模型考虑了固定效应(如块和重复)和随机效应(如基因型和误差)。模型的评估指标包括预测准确率、均方根误差(RMSE)、交叉验证决定系数(R2)和预测偏差(Bias)。研究通过将数据集分为训练集(80%)和外部验证集(20%),对模型进行了多次交叉验证,以确保模型的泛化能力。
### 实验结果
在所有评估的性状中,DMCg的预测性能最低。其预测准确率(R)范围为0.53至0.83,而均方根误差(RMSE)则相对较高,从1.89至2.05不等。这表明在使用新鲜样本时,DMCg的预测难度较大。然而,当使用加工样本时,预测准确率显著提高,R值达到0.77至0.95,RMSE下降至1.35至2.11之间。这说明加工样本在NIR光谱分析中更具一致性,有助于提高模型的预测性能。
对于StC的预测,NIR.QST设备在加工样本上表现优于NIR.N500设备。使用NIR.QST和加工样本时,PLS模型的预测准确率(R)达到0.76,均方根误差(RMSE)为1.87,而NIR.N500设备的预测准确率为0.75,RMSE为1.93。尽管NIR.N500设备在某些情况下表现更优,但NIR.QST在加工样本上的表现依然稳定,尤其在外部验证中,其预测准确率进一步提升。
在DMCo的预测中,NIR.N500设备表现最佳,尤其在使用PLS和XGB模型时,预测准确率(R)分别为0.98和0.97,均方根误差(RMSE)则分别为1.35和1.47。相比之下,NIR.QST设备在加工样本上的预测准确率(R)为0.93和0.92,均方根误差(RMSE)为1.47和1.50。这些结果表明,尽管NIR.N500设备在性能上更优,但NIR.QST在适当处理样本的情况下,仍能提供可靠的预测结果。
此外,KNN模型在所有测试中表现最差,尤其在使用NIR.QST设备预测StC时,预测准确率仅为0.45至0.68,均方根误差(RMSE)高达2.02。这说明KNN模型在处理甘薯样本时存在较大的预测偏差和不稳定性,特别是在处理新鲜样本时。相比之下,PLS和XGB模型在多数情况下表现优异,且在不同样本类型和设备上均具有较好的泛化能力。
### 讨论
本研究的结果表明,样本的处理方式对NIR模型的预测性能具有显著影响。加工后的样本因其结构均匀性,能够减少光散射和水分分布的差异,从而提高模型的预测准确性。相比之下,新鲜样本由于内部生物化学梯度的存在,如淀粉在中央皮层和干物质在表皮附近的分布,导致预测结果存在较大波动。因此,在使用便携式NIR设备时,样本的加工处理尤为重要。
从设备性能来看,桌面型NIR.N500在多数情况下表现出更高的预测准确率和更稳定的信号。其高分辨率和精确的校准能力使其在处理复杂样本时更具优势。然而,便携式NIR.QST设备在加工样本上的表现同样出色,尤其是在外部验证中,其预测准确率甚至超过了桌面型设备。这表明,尽管便携式设备在某些情况下可能不如桌面型设备精确,但在实际育种过程中,其便携性和快速响应能力具有显著优势。
在机器学习模型的选择上,PLS模型在所有测试中均表现出最高的预测准确性,特别是在DMCo和StC的预测中。其较低的均方根误差(RMSE)和较高的决定系数(R2)表明,PLS在处理高维光谱数据时具有较强的鲁棒性。相比之下,KNN模型在处理新鲜样本时表现较差,但在某些特定情况下(如NIR.N500设备预测DMCo)仍能提供可接受的预测结果。XGB模型则在非线性关系建模方面表现出色,尤其在预测StC和DMCo时,其性能接近PLS模型。
### 未来展望
近红外光谱技术在甘薯育种中的应用前景广阔。其非破坏性、快速和低成本的特点,使其成为传统实验室方法的有力替代。尤其是在早期育种阶段,NIR技术能够显著提高表型评估的效率,帮助育种者更快地筛选出优良基因型。此外,NIR技术还可以用于长期的表型监测,为育种者提供更全面的数据支持。
从育种的角度来看,NIR技术的应用不仅提高了评估的准确性,还加速了育种进程。通过将NIR技术与机器学习模型相结合,育种者能够更高效地识别出具有优良性状的基因型,从而推动高产、抗病和高质量甘薯品种的开发。同时,NIR技术的高通量特性,使得大规模样本的分析成为可能,进一步降低了表型评估的成本,提高了育种工作的效率。
然而,尽管NIR技术在甘薯育种中展现出巨大的潜力,其实际应用仍面临一些挑战。例如,便携式设备的光谱分辨率和信噪比可能低于桌面型设备,这在复杂或变化的田间条件下可能会影响预测性能。因此,为了确保NIR技术的广泛应用,需要进一步优化样本处理流程,制定标准化的采样和分析协议,以提高模型的泛化能力和可迁移性。
此外,NIR技术的预测结果还需要在不同基因型和环境条件下进行独立验证,以确认其在实际育种中的可靠性。研究团队建议,在推广NIR技术之前,应进行更广泛的测试,尤其是在不同季节和地理区域中,以确保其在各种条件下都能提供准确的数据。
### 结论
本研究揭示了NIR光谱技术在甘薯育种中的重要性,并指出选择合适的预测模型、设备和样本处理方式对于提高预测准确性至关重要。加工样本因其结构均匀性,在大多数情况下均优于新鲜样本,而便携式设备在适当处理样本的情况下,也能提供可靠的预测结果。此外,PLS模型在多数情况下表现出最佳的预测性能,而KNN和XGB模型则在某些特定场景下具有竞争力。
综上所述,NIR光谱技术为甘薯育种提供了一种快速、准确且可扩展的解决方案。通过合理选择设备和模型,并优化样本处理流程,NIR技术有望成为推动甘薯育种效率和质量的重要工具。未来的研究应进一步探索NIR技术在不同作物和性状中的应用,以实现更广泛的技术推广和实际应用。
生物通微信公众号
生物通新浪微博
今日动态 |
人才市场 |
新技术专栏 |
中国科学人 |
云展台 |
BioHot |
云讲堂直播 |
会展中心 |
特价专栏 |
技术快讯 |
免费试用
版权所有 生物通
Copyright© eBiotrade.com, All Rights Reserved
联系信箱:
粤ICP备09063491号