分析与测试
国际糖尿病联盟(IDF)数据显示,全球糖尿病患者数量已超5.37亿(2021年),预计2045年将增至7.83亿[1]。精准的血糖监测是糖尿病管理的关键,但现有有创检测方法存在疼痛、感染风险及心理抵触等问题[2,3],红外光谱技术因其非侵入性和高灵敏度成为研究热点[4-8]。然而,不同光谱技术的选择缺乏统一标准,亟需对比分析。
近红外光谱技术(NIR)是根据葡萄糖分子在近红外区域(波长780~2 500 nm)具有的吸收和散射特征,利用现代计量学手段建立血糖浓度与近红外光谱之间的回归模型,实现对血糖浓度的无创检测。虽然NIR对水和葡萄糖的吸收程度不显著,但穿透力强,有高达95%的光可以通过皮肤角质层和表皮到达血浓度较高的区域,而不受皮肤色素沉着的影响,所以一直是研究无创血糖检测的首选方法[9]。吕晓凤等[10]使用近红外反射光谱的无损血糖检测方法,测量了人体手掌在800~2 500 nm的漫反射光谱,结合单一个体的口服糖耐量实验(Oral Glucose Tolerance Test,OGTT),所得个人PLS模型RMSEP为0.41 mmol/L。Ming等[11]采集了100组1 500~1 800 nm波长范围内的手指近红外反射光谱,使用反向传播模型预测效果,结果表明RMSEP为0.295 2 mmol/L,相关系数为0.986 3。Khan等[12]在同一患者身上比较近红外光的透射和反射两种方法的准确性,结果表明近红外漫反射法的精度为89.83%,RMSE值为8.167 mg/dL,近红外透射法的精度为93.04%,RMSE值为6.572 mg/dL。谢军等[13]采用光程2 mm的石英比色皿测量血清样品的近红外光谱,并结合数据集划分、SG平滑预处理和PLS模型来改善模型预测能力,其RMSEP为0.376 mmol/L。
中红外光谱技术(MIR)是很多物质吸收的“fingerprint”区域,具有强烈的振动,特征吸收峰更清晰,有更好的特异性。20世纪80年代,Kaiser提出结合CO2激光器与衰减全反射(ATR)来实现血液中葡萄糖测量的方法[14]。近年来也出现了大量利用中红外测量血浆、血清及全血中葡萄糖的报道。Jernelv等[15]利用外腔量子级联激光器EC-QCL(调谐范围1 200~900 cm-1)测定以乳酸和尿素为干扰物的水溶液中的葡萄糖和白蛋白。采用基于衰减全反射(ATR)和透射两种光纤耦合测量装置。在透射式测量中葡萄糖的交叉验证均方根误差(RMSECV)值为8.5 mg/dL,ATR方式为10.2 mg/dL,ATR略高于透射测量。Chen等[16]利用MIR-ATR方法,分别对食指和前臂进行测量,得出最佳波数范围为3 500~3 000 cm-1,最佳测试目标为食指,但文中没有给出 RMSEP值。
尽管现有研究已证实红外光谱技术在无创血糖检测中的潜力,但不同检测方法(MIR-ATR、MIR-TR、NIR-TR)的定量精度差异尚未系统评估。本研究通过对比分析3种技术在无创血糖定量检测中的性能差异,旨在为临床选择最优检测方案提供依据。红外光谱重叠严重、有效信息弱、易受外界噪声干扰,因此通常需要对光谱数据进行数据集划分和预处理,建立定量模型,以去除干扰信息对预测模型的不良影响[17]。故本研究采用3种数据集划分方法和5种预处理方法进行对比分析,并建立2种定量分析模型来进行验证,通过控制实验变量(数据集划分方法、预处理方法、定量分析模型),明确3种技术的优劣及其适配模型。
INVENIO-S型傅里叶变换红外光谱仪(德国Brucker公司)。
intralipid仿体溶液(质量分数20%,江苏省无锡市费森尤斯卡比华瑞制药有限公司);无水葡萄糖(分析纯,上海麦克林生化科技股份有限公司)。
1.2.1 样本制备
采用母液配制法配制30组葡萄糖仿体溶液(0.2~5 g/L,间隔为0.2 g/L),并增设5组中间浓度样本(0.5、1.5、2.5、3.5、4.5 g/L)以增强模型鲁棒性。
1.2.2 光谱测量
中红外光谱(4 000~650 cm-1)分辨率设为 4 cm-1,扫描16次取平均;近红外光谱(1 000~2 500 nm)分辨率8 cm-1,扫描32次取平均。
MIR-ATR实验使用ZnSe晶体附件。ATR样品槽在每次采样前经过严格的清洁流程,首先用超纯水冲洗ATR样品槽,再用含有无水乙醇的无尘棉球单方向擦拭样品槽,最后再用擦镜纸擦拭。用氮气吹干后,利用滴管将样品吸取1 mL滴入样品槽。当样品均匀完整地覆盖样品槽镜面后,放入光谱仪进行测量。
MIR-TR实验使用50 μm液体池。首先用超纯水冲洗液体池,再用含有无水乙醇的无尘棉球清洁窗口表面,然后用氮气吹干。将垫片放置在其中一个窗口上,确保对齐。用滴管吸取适量样品滴加在垫片中央,轻轻压紧另一片窗口,避免气泡产生。用夹具固定窗口后进行测量。
NIR-TR实验使用2 mm石英比色皿。测量前,为确保样品槽的洁净与数据的准确性,比色皿先用超纯水充分冲洗,随后使用擦镜纸擦拭,再用氮气吹干。取适量样品滴入比色皿中,避免产生气泡。样品置入仪器后立即开始测量,以减少因暴露时间过长引起的误差变化。
3组实验均使用相同的样本,共得到90个光谱数据。
分别建立PLS、PCR两种模型,对光谱数据进行葡萄糖定量分析。为了直观比较不同模型以及不同处理方法的性能,采用2个评价指标来综合评估,分别是Rp和RMSEP。当Rp接近1且 RMSEP接近0时,表示模型的预测效果好,稳定性高。反之,如果Rp较低或RMSEP较高,则需要对模型进行优化。
分别采用SPXY(Sample Set Partitioning Based on Joint x-y Distances Method)、KS(Kennard Stone)和等间隔划分(Equally Spaced Division,ESD) 3种方法划分数据集。划分前未进行预处理,校正集和验证集划分比例为3∶1。数据集划分后共有22个校正集样本,8个验证集样本。通过Rp和RMSEP指标进行综合评价,优选最佳划分方法。
不同的噪声干扰需要采用不同的去除方式。本研究采用了5种预处理方法,包括卷积平滑滤波(Savitzky-Golay Smoothing,SG)、标准正态变量变换(Standard Normal Variate,SNV)、直接正交信号校正(Direct Orthogonal Signal Correction,DOSC)、多元散射校正(Multiplicative Scatter Correction,MSC)和Savitzky-Golay一阶求导(SG_1)。通过Rp和RMSEP指标比较它们在去除不同噪声时的效果,探究最佳的预处理方法。
实验使用不同检测方式采集的30个葡萄糖仿体溶液吸收光谱如图1所示。由图1a可以发现,MIR-ATR的吸收光谱在800~650和4 000~2 800 cm-1范围内噪声较大,有效信息较少,故选取图1b所示的2 800~800 cm-1波段进行后续分析。图1c显示了MIR-TR的原始光谱,由于光谱范围900~600和4 000~3 000 cm-1出现噪声,需剔除影响分析效果的低信噪比波段。因此,MIR-TR实验选取图1d所示的3 000~900 cm-1波段用于后续分析。图1e显示了NIR-TR原始光谱图,由于在1 340~1 600、1 800~-2 150和2 150~2 500 nm这3个波段出现因吸收强度过高导致吸收饱和现象,原始光谱的信噪比较低,故NIR-TR实验选择1 000~1 340、1 600~1 800和2 150~2 300 nm这3个波段用于后续建模分析。
a.MIR-ATR原始谱图;b.MIR-ATR实验谱图;c.MIR-TR原始谱图;d.MIR-TR实验谱图;e.NIR-TR原始谱图
图1 MIR-ATR、MIR-TR、NIR-TR采集的原始吸收光谱及实验波段光谱图
Fig.1 Original absorption spectra and experimental band spectra collected by MIR-ATR,MIR-TR,and NIR-TR
本研究采用了3种数据集划分方法(SPXY法、KS法和ESD法)将光谱数据划分为校正集和预测集,并使用PLS和PCR两种模型进行定量分析。
在PLS模型中,采用留一交叉验证确定主因子数(f)。不同数据集划分方法在PLS模型中的最佳主因子数通过留一交叉验证的结果确定,即对主因子数1~20进行遍历,最小RMSECV值的主因子数即为最佳主因子数。而PCR模型使用累积贡献率来表示主因子数,本研究将累积贡献率设定为85%作为主因子数的阈值。
3种检测方法在不同数据集划分下的PLS建模结果如表1所示。对比表1可知,在检测方法和建模方法不变的情况下,不同的数据集划分方法会影响模型预测效果。对于MIR-ATR检测方法,ESD法的Rp值最大,为0.999 1;对应的 RMSEP值最小,为0.078 7 g/L,表明ESD法是最佳数据集划分方法,其次是KS和SPXY。对于MIR-TR检测方法,KS法的Rp值最大,为0.959 9;对应的RMSEP值最小,为0.428 8 g/L,表明KS法是最佳数据集划分方法,其次是SPXY和ESD。对于NIR-TR检测方法,SPXY法的Rp值最大,为0.957 4;对应的RMSEP值最小,为0.070 3 g/L,表明SPXY法是最佳数据集划分方法,其次是KS和ESD。通过表1的数据对比可知,3种测量方法对应着不同的最佳数据集划分方法,其中 MIR-ATR结合ESD表现最佳,其次是NIR-TR和MIR-TR。表1的结果表明,PLS模型依赖浓度与光谱的线性关系,ESD的均匀划分能强化其回归稳定性(表1中MIR-ATR+ESD+PLS的Rp接近1)。
表1 不同数据集划分下的PLS模型效果对比
Tab.1 Comparison of PLS model performance under different datasets
DatasetpartitioningmethodMIR-ATRMIR-TRNIR-TRRpRMSEP/(g·L-1)RpRMSEP/(g·L-1)RpRMSEP/(g·L-1)ESD0.99910.07870.94910.57210.91910.1599KS0.99810.07910.95990.42880.88220.1105SPXY0.99820.09340.89030.48390.95740.0703
3种检测方法在不同数据集划分下的PCR建模结果如表2所示。对比表2可知,对于MIR-ATR检测方法,KS法的Rp值最大,为0.952 4,对应的RMSEP值为0.971 3 g/L,比SPXY法的RMSEP值略高,但SPXY的Rp值比KS低,故认为KS法是最佳数据集划分方法,其次是SPXY和ESD。对于MIR-TR光谱,SPXY法的RMSEP值最小,为1.124 8 g/L,表明SPXY法是最佳数据集划分方法,其次是KS和ESD,但相比于其他方法,MIR-TR的整体预测效果较差。对于NIR-TR光谱,SPXY法的Rp值最大,为0.983 4;对应的RMSEP值最小,为0.056 8 g/L,表明SPXY法是最佳数据集划分方法,其次是KS和ESD。结果对比可知,3种检测方法中NIR-TR的效果最好,Rp值普遍在0.9以上,RMSEP值也比MIR两种方法低很多。表2的结果表明,PCR模型基于主成分分解,KS法通过光谱多样性提升主成分代表性(表2中MIR-TR+KS+PCR的Rp=0.390 0优于ESD的0.096 3)。
表2 不同数据集划分下的PCR模型效果对比
Tab.2 Comparison of PCR model performance under different datasets
DatasetpartitioningmethodMIR-ATRMIR-TRNIR-TRRpRMSEP/(g·L-1)RpRMSEP/(g·L-1)RpRMSEP/(g·L-1)ESD0.61881.04950.09631.38190.92080.2241KS0.95240.97130.39001.15520.90950.0988SPXY0.88960.85620.38711.12480.98340.0568
数据集划分方法的选择显著影响模型性能(表1、2)。ESD法在MIR-ATR中表现最优,因其与仿体溶液的标准浓度梯度高度匹配;而SPXY在NIR-TR中的优势揭示了其对噪声和非线性关系的适应性。值得注意的是,KS法虽在MIR-TR的PLS模型中Rp较高(0.959 9),但其在PCR模型中的波动性(Rp=0.390 0~0.952 4)提示其对模型类型敏感。
根据以上结果,PLS模型选用的数据集划分方法为ESD,PCR模型选择的数据集划分方法为SPXY,本节采用5种预处理方法(SG、SNV、DOSC、MSC、SG_1)进行处理,并且加入无预处理方法(Raw)进行对比分析。
表3为经过预处理后的PLS建模结果。通过比较,发现MIR-ATR采用5种预处理方法后的RMSEP值均增加,Rp值均减小,原因可能是在处理数据过程中放大了噪声,故对于MIR-ATR来说,无预处理效果更好。MIR-TR结合SG方法预测效果最佳,相较于无预处理,Rp由0.959 9提升为0.996 8,RMSEP由0.428 8 g/L减小到0.106 6 g/L,模型性能有较大提升。NIR-TR结合DOSC方法效果最佳,相较于无预处理,RMSEP由0.089 5 g/L减小到0.072 7 g/L,但Rp由0.973 3减小为0.968 0,效果变化较小。综上所述,优选预处理方法之后,最佳检测方式为未经预处理的MIR-ATR。
表3 不同预处理方法结合PLS模型预测结果对比
Tab.3 Comparison of prediction results of different pretreatment methods combined with PLS model
Pretreat-mentmethodMIR-ATRMIR-TRNIR-TRRpRMSEP/(g·L-1)RpRMSEP/(g·L-1)RpRMSEP/(g·L-1)Raw0.99910.07870.95990.42880.97330.0895MSC0.67991.17080.94270.95660.90820.1157SG_10.99790.10910.95810.41740.94560.0983SNV0.92230.41510.94390.91240.93860.0991SG0.99760.12560.99680.10660.97350.0922DOSC0.99880.10500.95730.37940.96800.0727
表4为经过预处理后的PCR建模结果。对比发现,MIR-ATR结合DOSC方法效果最佳,相较于无预处理情况Rp由0.952 4提升为0.994 4,RMSEP由0.971 3 g/L减小到0.886 5 g/L,但MSC和SNV方法处理后模型效果下降幅度大,表明不同预处理方法对模型性能影响较大。MIR-TR结合DOSC方法效果最佳,相较于无预处理情况Rp由0.387 1提升为0.929 9,RMSEP由1.124 8 g/L减小到0.546 3 g/L,模型效果提升很大。说明DOSC算法能够有效地去除MIR-TR中的噪声,改善PCR模型的性能。NIR-TR采用5种预处理方法后的预测效果都出现了下降,且发生了过拟合现象,表明模型过度处理,数据可信度不高。原因可能是NIR-TR挑选出的实验波段已经剔除了大部分的噪音信号,加入预处理可能会过度去噪,将部分有效信息去除。而MIR-ATR和MIR-TR被覆盖的信号少,可用波段较多,能检测到更多有效信息。综上所述,最佳检测方式是无预处理的MIR-ATR。
表4 不同预处理方法结合PCR模型预测结果对比
Tab.4 Comparison of prediction results of different pretreatment methods combined with PCR model
Pretreat-mentmethodMIR-ATRMIR-TRNIR-TRRpRMSEP/(g·L-1)RpRMSEP/(g·L-1)RpRMSEP/(g·L-1)Raw0.95240.97130.38711.12480.98340.0568MSC-0.27101.66340.43661.09460.94950.0737SG_10.94200.99710.40711.04200.90590.0902SNV0.13481.39590.43201.09730.96550.0565SG0.95160.96890.46471.00150.92780.0854DOSC0.99440.88650.92990.54630.95680.0703
对比表5结果可知,MIR-ATR的建模效果最佳。结合图1光谱图来看,MIR-ATR和MIR-TR两种方式具有较宽的波段范围,意味着他们可以获取更多的有效信息,从而提供更准确的葡萄糖吸收数据。相比之下,NIR-TR方式在选择实验波段时剔除了大部分噪音信号,虽然可以降低干扰,提高信号质量,但这也可能导致一些被噪音覆盖的有用信号被剔除。而MIR-ATR和MIR-TR的可选取的波段范围更广,可以更全面地获取有效信息,减少对有用信号的丢失。综上所述,MIR-ATR为最佳检测方式。
表5 3种检测方法最佳结果对比
Tab.5 Comparison of results of three detection methods
DetectionmethodQuantitativemodelDatasetpartitioningmethodPretreatmentmethodRpRMSEP/(g·L-1)MIR-ATRPLSESDRaw0.99910.0787MIR-TRPLSKSSG0.99680.1066NIR-TRPCRSPXYRaw0.98340.0568
MIR-ATR的显著优势归因于:1)表面增强效应。ATR附件通过全反射棱镜产生倏逝波,其穿透深度(0.5~2 μm)与葡萄糖分子的振动吸收层厚度匹配,从而显著增强中红外波段的特征信号。相较于透射法(MIR-TR/NIR-TR),ATR技术避免了光程过长导致的能量衰减,尤其适用于高吸收系数的中红外区域;2)指纹区特异性。中红外光谱覆盖葡萄糖分子的指纹区(如C—O伸缩振动~1 030 cm-1、O—H弯曲振动~1 400 cm-1),其吸收峰尖锐且特异性强。ATR技术通过表面局域场增强效应,放大了这些特征峰的信号强度(图1b),而NIR-TR因葡萄糖在近红外区的泛频吸收较弱,需依赖复杂的预处理算法补偿信噪比不足的问题;3)抗干扰能力。ATR附件的短光程(微米级)可有效抑制水分子(~3 400 cm-1和~1 640 cm-1)的强吸收干扰,而MIR-TR因使用液体池(50 μm光程)可能因水背景信号过强掩盖葡萄糖特征峰。此外,ATR的接触式测量减少了散射噪声,而NIR-TR在穿透皮肤仿体时易受散射影响。这解释了为何MIR-ATR在未经预处理时仍能保持最优性能(表5),而MIR-TR和NIR-TR需依赖预处理补偿技术局限。
本研究采用配制的葡萄糖仿体溶液模拟人体血糖情况,运用MIR-ATR、MIR-TR和NIR-TR光谱检测技术,对葡萄糖定量分析进行研究。建立了PLS和PCR葡萄糖定量分析模型,用Rp和RMSEP评估效果。使用3种数据集划分方法(ESD、KS和SPXY),在3∶1的划分比例下对比,优选出最佳数据集划分方法。使用5种预处理方法(MSC、SG_1、SNV、SG和DOSC)对比,优选出最佳预处理方法。从而比较分析出3种检测方法的优劣。
研究结果表明:1)MIR-ATR技术因高信噪比(Rp>0.999)和低误差(RMSEP<0.08 g/L)成为葡萄糖定量检测的最优选择;2)ESD数据集划分法与PLS模型的组合可最大化MIR-ATR的性能,而NIR-TR因有效信息丢失导致预测稳定性不足;3)本研究为无创血糖检测的光谱技术选择提供了实证支持,后续可拓展至人体活体实验验证。
本研究证实MIR-ATR+PLS+ESD组合在葡萄糖仿体溶液中具有最优定量性能,但需注意:仿体溶液简化了血液的复杂基质效应,实际应用中可能受血红蛋白、皮肤透光性等因素影响。因此,未来研究需聚焦临床血样验证及柔性ATR探头开发,以解决实际应用中的个体差异问题。
[1]International Diabetes Federation.IDF Diabetes Atlas,10th Edition.Brussels,Belgium:International Diabetes Federation,2021.
[2]Yang Y X,Wu B,Lin H J,Li J M,Zhang F,Zhang C L,Peng M.J.Instrum.Anal.,2022,41(4):578-586.杨宇祥,吴彬,林海军,李建闽,张甫,张彩丽,彭敏.分析测试学报,2022,41(4):578-586.
[3]Song J,Wang T J,Feng T,Chan S Y,Rong F,Li P,Huang W.Mater.Rep.,2020,34(1):1 126-1 134.宋江,王腾蛟,冯涛,CHAN Siew Yin,荣帆,李鹏,黄维.材料导报,2020,34(1):1 126-1 134.
[4]Peng J,Shao X G,Chu G H.Chin.J.Anal.Lab.,2023,42(10):1 285-1 291.彭娟,邵学广,楚刚辉.分析试验室,2023,42(10):1 285-1 291.
[5]Li C Y,Ye L M,Xue J T.Phy.Test.Chem.Anal.Chem.Anal.,2023,59(11):1 407-1 412.李春燕,叶利明,薛金涛.理化检验-化学分册,2023,59(12):1 407-1 412.
[6]Peng Z Q,Yang Z Q.Analyst,2024,149:4 830-4 841.
[7]Liu H,Liu W X,Sun C X,Huang W Z,Cui X L.Sens.Actuators,A,2024,374:115 500.
[8]Li T X,Wang Q G,An Y,Guo L,Ren L N,Lei L H,Chen X L.Biomed.Signal Process.Control,2025,106:107 750.
[9]Qi D M,Yang Q,Liu Q.J.Beijing Inst.Petrochem.Technol.,2024,32(2):5-10;59.戚栋铭,杨强,刘强.北京石油化工学院学报,2024,32(2):5-10;59.
[10]Lv X F,Zhang T L,Xiao F,Li G,Wang Y.Spectrosc.Spectral Anal.,2016,36(7):2 312-2 317.吕晓凤,张婷琳,肖锋,李光,王酉.光谱学与光谱分析,2016,36(7):2 312-2 317.
[11]Ming C Z,Raveendran P.2009 International Conference for Technical Postgraduates (TECHPOS).Kuala Lumpur:IEEE,2009:1-4.
[12]Khan T R,Mostofa A,Dey M.2023 International Conference on Electrical,Computer and Communication Engineering (ECCE).Chittagong:IEEE,2023:1-6.
[13]Xie J,Pan T,Chen J M,Chen H Z,Ren X H.Chin.J.Anal.Chem.,2010,38(3):342-346.谢军,潘涛,陈洁梅,陈华舟,任小焕.分析化学,2010,38(3):342-346.
[14]Kaiser N.Horm.Metab.Res.,Suppl.Ser.,1979,(8):30-33.
[15]Jernelv I L,Strøm K,Hjelme D R,Aksnes A.Sensors (Basel),2019,19(23):5 130.
[16]Chen Y,Liu J,Pan Z,Shimamoto S.2020 IEEE 17th Annual Consumer Communications &Networking Conference (CCNC).Las Vegas:IEEE,2020:1-5.
[17]Zhu S C,Gao X Y,Zhang Z S Y,Cao H M,Zheng D Y,Zhang L,Xie Q L,Sa J M.Chin.J.Anal.Chem.,2022,50(9):1 415-1 424.朱思聪,高西娅,张朱珊莹,曹汇敏,郑冬云,张莉,谢勤岚,撒继铭.分析化学,2022,50(9):1 415-1 424.