《武汉工程大学学报》 2020年01期
28-32
出版日期:2021-01-25
ISSN:1674-2869
CN:42-1779/TQ
便携式拉曼光谱仪结合化学计量法的水质分析
近年来,工业的加速发展使得水污染问题日益严重,据生态环境部门调查报道,2019年全国部分地区出现水质恶化,水质急剧下降的势头,需要加强饮用水水源的监控,而水污染的严重问题作为一个严重的公共危机,亟待解决[1]。在污染物质检测的领域,有电感耦合高频等离子体发射光谱法、红外光谱法、水污染生物检测法等检测方法[2-5],但由于大部分的水质检测方法对测试样品的要求比较高,需要繁琐的制备过程,对人员的操作和仪器的要求较高,大部分都只能在专门的检测机构才能够实现,造成检测周期比较长,严重影响了测试的效率。为了达到快速检测分类水质的目的,需要寻找一种快速简便的方法,以便加强对湖水的保护和管理。随着时代的进步,对水质的要求也日益增高,寻找便捷、系统的分析水质的方法有着重要的实用意义。拉曼光谱作为一种光谱检测手段,近年来受到广泛关注[6-7],由于其快速、高效、能进行无损分析等优点,已经成功用于化学、材料、物理、高分子、生物、医药、地质等各个不同的领域[8-11]。因此,拉曼光谱法的快速、简单等优势使之具有检测分类水质的极大潜力。通过查阅文献,前人对利用拉曼光谱对水质检测的科学性和可实施性做了充分阐述[12],例如对水体中的污染物[13]、养殖水体中的氮元素[14]的检测等。充分体现了以下优势:在对水质进行检测时,不仅只需要少量的样品和简便的制备过程,即取即测;并且其检测过程快速、简单、可重复、无损伤,一次可覆盖波数的区间广,能够达到我们想要快速检测的目的,而不同的水质中存在的各种杂质使得每种水样的光谱图间存在差异,这些光谱如同“人的指纹”,能利用这些特征光谱图快速的区分不同的水质,非常适合应用于水质检测领域。在得到光谱数据后,由于这些光谱的数据信息量盈千累万,而其有标志波段多、数据繁冗性强等缺点,若直接使用原始的光谱数据,可能造成分析过程复杂、数据结果不准确等,不利于后阶段数据的分析处理,所以需要对数据提前进行初筛和预处理的操作,目的是剔除无效的冗余信息,提取有效部分并且有助于利用数据的潜在价值。所以针对大量的光谱数据,提取数据信息、整合信息是非常重要的,而进行聚类分析是一种行之有效的处理方法。为此,我们通过结合已建立的数据分析策略的优势,为从多种来源的水样的拉曼光谱数据的整合提供了一种有效的工具,即利用化学计量法处理光谱数据。综上所述,利用便携式拉曼光谱仪来检测湖水的光谱,能实现高效快速检测的目的,再结合化学计量法中的正交偏最小二乘法判别分析(orthogonality partial least squares-discfriminant analysis,OPLS-DA)模式的分析,能够完整准确的分析光谱数据,实现快速分类不同的污染水质的目的。1 实验部分1.1 材料及其前处理水样A取自近郊黄陂区盘龙城开发区境内的盘龙湖,水样B取自洪山区的汤逊湖,水样C取自江夏区芳郁大道的静思湖,水样D取自武昌区的长江,水样O是实验室中的蒸馏水。水样A,B来自于湖水面积较大、流通的水域,肉眼观察水样中有较少悬浮物,但较为清澈。水样C来自于湖水面积较小,不流通的死水,肉眼观察水样悬浮物较多,颜色较为暗沉。水样D来自长江流域,肉眼可观察到悬浮物较多,水样颜色浑浊发黄,水样O是对照组水样。取水样O建立对照组的目的是建立一个能够观察到差异,提供有意义解释的模型。因为从不同区域取得的湖水样品中含有各类悬浮的物理颗粒,悬浮颗粒会干扰测量过程,使得到的光谱结果不准确,所以不适合直接作为检测样品。因此在测量前需要对不同的检测样品做简单的预处理。各取4 mL的水样样品,将离心机的转速设置为3 000 r/min,离心时间设置为5 min。待离心完成后,将水样的上清液和沉淀分开,将离心后的上清液作为实验所测样品。1.2 光谱仪器采集的方法1)取上清液,使用激发波长为780 nm以及785 nm的拉曼光谱仪检测,将不同的湖水样品注入石英比色皿,并且使得液面与比色皿外壁平齐,保持每次测量液面高度一致,即开始测试。2)取水样离心后的沉淀,晾干后取2 g样品,置于紫外载玻片上,检测并采集沉淀光谱。3)为保证实验中光谱不被外界杂光和实验器材表面杂质所干扰,光谱采集过程需在暗室条件下进行,而使用的实验器材需经酒精冲洗,激光照射在样品上的功率为500 mW,积分时间为10 s。1.3 数据处理方法、化学计量学方法软件1.3.1 数据处理方法 实验利用 Matlab 软件采用自适应迭代惩罚最小二乘法(adaptive iteratively reweighted Penalized Least Squares, airPLS)对水样的光谱图实现批量扣除光谱背景[15-18]。惩罚最小二乘法是一种灵活的平滑方法,主要包括两个方面:惩罚最小二乘法对信号的平滑和自适应迭代将惩罚过程转变成一个基线估计的惩罚最小二乘算法[19]。该方法易于操作,无需用户的任何介入和初始信息。是在惩罚最小二乘的基础上,通过迭代过程中的自适应地调节拟合基线与原始信号之间总体方差(sum of squares for error,SSE)的权重,而SSE的权重由自适应使用前拟合基线与原始信号的差异得到。该方法能够快速灵活的扣除不规则变化的基线[20]。这种基线处理方法对数据要求低,处理过程便捷快速,很适合大批量样本集。1.3.2 化学计量学方法 OPLS-DA是一种改进PLS的方法[21],集成了一个正交信号校正滤波器,滤除了自变量矩阵中与量矩阵无关的信息,即随机噪声。正交矫正后与偏最小二乘法(partial least squares, PLS)结合并对PLS进行修正,可以过滤掉与反应无直接关系的变化,使生成的结果更清晰,并易于解释。OPLS-DA是将正交信号校正方法(orthogonal signal correction, OSC)与PLS相互结合同时对偏最小二乘法进行改进。OPLS经过信息矫正后滤除了随机噪声,相应的预测分数和加载向量因此较少受正交变化影响。OPLS-DA的主要优点是对模型的更简单的解释,因为它侧重于预测组件中概述的以判别为主的预测信息,所以OPLS-DA区分组间差异的能力强,可以优化模型的可信程度和解析能力。实验中将去除基线的光谱数据导入到simca软件包中采用OPLS-DA模型建模。2 拉曼光谱图1(a)中光谱分别为785 nm的便携式拉曼光谱仪所测得的水样C的上清液、785 nm的便携式拉曼光谱仪和780 nm拉曼光谱仪所测得的沉淀的光谱图。由图1(a)可以看出,拉曼光谱仪所测得湖水离心后上清液的拉曼光谱和沉淀的拉曼光谱比较相似,且上清液的拉曼光谱信息更丰富,因而本实验中运用上清液的拉曼光谱分析水质。上清液的拉曼光谱主要包含两个部分,3 000~3 500 cm-1区域内为水的拉曼光谱,1 000~2 000 cm-1区域内的光谱应主要与水中杂质相关。对比利用780 nm和785 nm 的拉曼光谱仪所测得的光谱数据,可知在1 000~2 000 cm-1区域内,两种激光器所测出沉淀的光谱有着极其相似的峰形,但在峰位上有些许差别。由检测结果可以看出由780 nm光谱仪所测的峰位在1 500 cm-1 附近,785 nm光谱仪所测的峰位在1 370 cm-1附近。利用拉曼频移公式算得,780 nm光谱仪测得的峰位1 500 cm-1对应波长约为880 nm,785 nm光谱仪所测得的峰位1 360 cm-1对应波长也约为880 nm。根据荧光产生的机理,在不同波长激光下同一物质的荧光光谱在峰宽和峰位上是比较相似的[22-24]。由此可见,图1(a)中湖水上清液在1 000~2 000 cm-1区域内的光谱属于杂质所产生的荧光。图1(b)是785 nm便携式拉曼光谱仪实际所测得的5种水样的光谱图。5种水样的光谱有明显的差别,特别是在1 000~1 500 cm-1区域内,主要与水中杂质荧光相关。同时在1 500 ~1 750 cm-1和3 000~3 500 cm-1区域内也有一定的差别,应该与杂质对水的振动光谱的影响相关。为了提取光谱的特征信息,从而更清晰准确的分析5种水样的光谱差别,利用airPLS算法对原始光谱进行了基线校正。图1(c)是实际所测得的5种水样去基线后的光谱图。3 结果与讨论由图2所示,通过SIMCA软件对5组水样样本数据进行OPLS-DA分析,模型参数R2X=0.767, R2Y=0.926, Q2=0.903,水样样本集中分布于置信区间中,模型拟合效果较好。在OPLS-DA模型的2d得分图图2(a)中,发现只有A,B两种水样混杂在一起,其余3种均能各自聚类,完全分开,分析未能将A,B水样区分开,原因可能是这2种水样的湖水水质和污染程度相近,不能很好判别开来,而剩余的几种水样均能分开并各自聚集在一起,分类效果较好。在OPLS-DA模型的3d图图2(b)中5种水样不仅完全分开,而且聚类效果非常好。总之,OPLS-DA模型的判别能力比较好,有良好的分类水质的能力。图2(c)为水样A和水样O的s-line图,图中的横轴表示了污水水样的波数, y轴表示的是相关系数,由图2(c)可看出在1 000~1 700 cm-1波段的荧光光谱所对应的相关系数较为明显,该波段的光谱所对应的相关系数比较大,则表示这个波段的光谱适合做一个marking值。图3中的交叉验证在给定的建模样本中,首先对数据进行了切分,拿出大部分样本进行建模型,留小部分样本用刚建立的模型进行泛化误差估计,记录它们的平方加和。看图中R2和Q2的截距,R2的截距小于0.4,Q2的截距小于0.5,说明这个模型未过拟合,是一个适用于湖水检测的良好模型,分类结果可信。4 结 论本文分析了4种湖水离心之后的上清液和沉淀的光谱特性,结果显示运用785 nm便携式拉曼光谱仪,并使用airPLS去除基线及OPLS-DA进行模式识别,不同水质的湖水可以很好的区分。同时OPLS-DA模型的s-line图发现区分4种湖水的特征波段在1 000~1 700 cm-1区域内。本文给湖水水质的快速分析提供了思路,相信便携式拉曼光谱仪结合化学计量法在未来快速水质分析方面会有更大的潜力。参考文献