
-
生物通官微
陪你抓住生命科技
跳动的脉搏
基于近红外光谱与改进预处理及波长选择技术的单滴血血红蛋白定量研究
【字体: 大 中 小 】 时间:2025年09月25日 来源:Scientific African 3.3
编辑推荐:
本研究针对传统血红蛋白(HGB)定量方法侵入性强、耗时长、需大量样本等问题,利用近红外(NIR)光谱技术结合改进的光谱预处理方法(Savitzky–Golay、SNV、MSC)和区间偏最小二乘(IPLS)波长选择算法,实现了仅需单滴血(8μL)的快速、精准HGB定量。结果表明,在2238.758–2307.405 nm波段筛选39个特征波长建立的模型性能优异(R2>0.9,RMSE<0.07),为贫血筛查和临床即时检测(POCT)提供了创新解决方案。
在临床诊断和患者监测中,血红蛋白(Hemoglobin, HGB)定量是评估贫血、营养状况和多种血液疾病的关键指标。然而,传统的检测方法如自动化血液分析或比色法不仅具有侵入性,还需要相对较大的采血量(通常通过静脉抽血),耗时长达30-60分钟,且依赖昂贵的化学试剂。这些局限性在急诊场景下尤为突出——当患者严重受伤、生命垂危时,快速评估血液状况至关重要。此外,现有非侵入式光学技术仍受生理条件、测量部位、血液浊度、皮肤色素沉着等因素干扰,其绝对误差通常在10–15 g/L之间。因此,开发一种快速、安全、可靠且只需微量样本的检测方法成为临床实践的迫切需求。
近红外(Near Infrared, NIR)光谱技术作为一种快速、无试剂、非侵入性的分析工具,近年来在生物医学领域展现出巨大潜力。该技术通过测量血液样本对近红外光的吸收特性,能够反映血红蛋白等分子的浓度信息。尽管已有研究尝试将NIR光谱应用于血红蛋白测定,但血液样本的复杂性、噪声干扰以及全波段建模的冗余性限制了其准确性和可靠性。如何通过优化光谱预处理和特征波长选择,提升模型的预测精度和泛化能力,成为当前研究的重点。
在这一背景下,由Fatima Ezzahra El Kamouny、Hassan Oukhouya、Younes Wadiai、Abdellah Madani、Khadija El Kamouny和Aziz Lmakri组成的研究团队在《Scientific African》上发表了一项创新研究。他们通过结合多种光谱预处理方法和区间偏最小二乘(Interval Partial Least Squares, IPLS)回归技术,成功实现了从单滴血(8μL)中快速、准确量化血红蛋白浓度的方法。
为开展本研究,团队采用了以下几项关键技术方法:
样本采集与处理:从AL QODS医学分析实验室获取400份人类血液样本(包括健康者和患者,HGB范围2.5–20 g/dL),使用EDTA抗凝管保存,并在4°C下24小时内完成NIR光谱采集和参考值测量(使用Sysmex SE 8000血液分析仪)。
光谱采集硬件:采用便携式NIR光谱仪(Viavi MicroNIR? 1700ES,波长范围1300–2600 nm)配合微量移液器(Eppendorf Research Plus)和盖玻片样本处理系统。
光谱预处理:综合应用 multiplicative scatter correction (MSC)、Standard Normal Variate (SNV) 和 Savitzky–Golay平滑滤波(SGM)方法,提升信噪比和光谱一致性。
建模与变量选择:使用偏最小二乘回归(PLS)和区间偏最小二乘(IPLS)方法,从1024个波长变量中筛选出最具预测力的特征波段。
模型验证:通过k折交叉验证(k=5)和独立测试集(120样本)评估模型性能,采用R2、RMSECV、RMSEP等指标进行量化评价。
研究人员首先将400份样本按7:3比例划分为训练集(280样本)和测试集(120样本),确保模型训练与评估的独立性。通过比较多种预处理组合(MSC+SNV、MSC+SGM、MSC+SNV+SGM),发现三者联用效果最优,训练集R2达0.989,RMSE为0.400,交叉验证R2为0.988,RMSECV为0.500,测试集R2高达0.990,RMSEP为0.140。这表明联合预处理有效消除了散射干扰和噪声,提升了数据质量。
通过系统比较不同预处理策略的性能,明确MSC+SNV+SGM序列为最优选择。该组合在保持光谱特征的同时显著降低了变异度,为后续波长筛选奠定了坚实基础。
在全波段(1024个变量)上构建PLS模型,经过5折交叉验证得到平均R2为0.861,表明模型具备良好的泛化能力。但全波段建模存在冗余计算和过拟合风险,凸显出特征选择的必要性。
采用IPLS方法将全光谱划分为26个子区间,通过构建局部PLS模型评估各区间预测性能。结果显示,区间I6、I5、I14、I7、I17和I4表现最佳,其RMSE介于0.060–0.068之间,R2在0.875–0.902范围内。这些区间对应血红蛋白吸收最强的光谱区域(2238.758–2307.405 nm),最终筛选出39个特征波长。
通过置换检验(随机打乱响应变量Y)验证波长选择的可靠性。结果显示,置换后模型性能显著下降(R2≈0),证实所选波长具有真实预测力而非随机噪声。
基于筛选出的39个波长构建优化PLS模型,在测试集上取得R2=0.89、RMSEP=0.067的优异性能。进一步使用81份独立样本进行外部验证,R2高达0.9188,RMSEP为0.070,预测值与实测值高度吻合(见图16-18)。残差分布接近正态,表明模型无显著偏差,具备高精度和鲁棒性。
本研究成功开发了一种基于近红外光谱和智能算法的高效血红蛋白定量方法,仅需单滴血(8μL)即可在1分钟内完成检测,准确率与传统方法相当。通过融合MSC、SNV和SGM预处理技术,有效提升了光谱质量;利用IPLS算法从1024个波长中精选出39个特征变量,不仅降低了模型复杂度,还显著提高了预测精度(R2>0.9)。该方法在贫血筛查、急诊医疗和资源有限场景中具有广泛应用前景。
然而,研究仍面临一些挑战:血液中血脂、胆红素等成分的干扰,个体差异(如年龄、肤色)、环境温湿度等因素可能影响测量准确性;样本前处理中需精确控制血量(8μL)和扩散均匀性;后续需通过多中心临床试验和医疗器械认证推动实际应用。尽管存在这些限制,该技术为开发便携式、无线化血检设备奠定了基础,有望推动即时检测(POCT)技术的革新。
本研究由摩洛哥卡迪阿雅德大学(Chouaib Doukkali University)LAROSERI实验室完成,所有作者均声明无利益冲突。论文数据真实、方法严谨,为NIR光谱在临床血液分析中的推广应用提供了重要参考。
生物通微信公众号
知名企业招聘