在自然环境中,土壤组成成分复杂多样,包含着肉眼难以识别的植物、微生物、气体和液体等,在这些成分的相互作用下,容易引起土壤污染[1]。土壤中存在大量的可用信息,可以帮助人们确定污染土壤的污染物的种类和程度,但如何通过技术研究从土壤成分中梳理出存在规律的物质是如今相关领域众多研究者的研究重点[2-3]。国际上土壤领域相关研究者以及地质学家通过研究数字化技术,在不使用化学成分的基础上获得土壤成分相关的数字图形,分析土壤中可能存在的污染物[4-6]。以往使用的土壤信息获取技术主要是人力采集数据[7],这种方法过度耗费人力和物力,数据获取结果也不足够精准。因此近年来我国研究者也在积极研究数字化土壤分析相关技术。相关地质及土壤研究者曾经从遥感技术的角度出发,结合卫星技术获取土壤信息,但是这种高精尖技术受到地理和空间环境的限制无法准确获取土壤详细信息。近年有学者从健康风险评估的角度提出土壤污染检测[8],使用哈斯图法分析土壤中的污染物获得土壤污染成分,但是该方法计算过程较为复杂,实现检测所需要的时间过长;还有学者提出一种以风险管控为基础的土壤重金属检测方法[9],主要利用单因子指数和富集系数,对土壤污染程度进行评级,虽然该方法也能检测出土壤中的污染程度,但检测准确性较低。
光谱技术中所涉及的红外光或激光的波长范围在650~2 600 nm之间,这段波长范围也是可见光与光谱之间的电磁波[10]。在自然环境下,土壤中包含数量庞大的氧化物、氨基化合物和烷烃类物质,这些物质的主要元素组成为碳、氢、氧和磷等,而光谱通常会在该波长范围吸收这些化学元素组成的特征官能基团,这是由于大部分有机物的组成结构都是在这个波长范围中获得光谱区信号,所以可以使用光谱技术检测土壤中的污染物获得较为准确的结果,而且光谱技术具有易获取、谱图稳定的特点,可以广泛应用于土壤污染检测领域[11-13]。基于此,本文以光谱技术作为基础,使用光谱仪器扫描土壤样品,利用差分吸收光学光谱技术测量土壤环境污染物含量,利用粒子群算法优化权值与Softmax分类器结合优化获得的深度学习自动编码器,对输入向量编解码,训练输入向量样本合集,构建深度神经网络的土壤污染物检测模型,从而提高土壤污染检测的速度和效果,以期为今后土壤污染治理打下一定基础。
本文利用差分吸收光谱技术(differential optical absorption spectroscopy, DOAS)实现对土壤污染物成分的检测。差分吸收光谱技术是一种利用空气中的气体分子的窄带吸收特性来鉴别气体成分,并根据窄带吸收强度来推演出微量气体的浓度光谱检测技术。与常规检测方法相比,其能够有效利用波长来进行污染物的监测,具有价格低廉、操作简单以及监测能力极为出色等优势。为了更好地实现土壤环境污染物成分检测,本文将DOAS技术引入该领域。基于光谱技术的土壤环境污染物成分检测流程,如图1所示。由图1可知,基于光谱技术的土壤环境污染物成分检测流程中,通过激光发射仪器对采集的土壤样品实施扫描,得出激光光谱,依据差分光学吸收光谱技术构建光谱数学模型,求解土壤环境成分未知含量,得出样品土壤环境污染物含量[14]。
图1 基于光谱技术的土壤环境污染物成分检测流程
Fig. 1 Detection process of soil environmental pollutants based on spectral technology
土壤环境污染物浓度通过差分光学吸收光谱实现测量。光在自然环境中,有些光会被散射,有些光会被吸收,剩余光按初始传播方向发射。依据比尔定律,发射功率如式(1)所示:
(1)
式中:L为波光需要通过的距离(m);Ci为激光的透射光强(cd);T为测试装置中光学系统的效率;S(t)表示大气湍流效应引起的激光功率随时间起伏的变化;Kai代表吸收土壤污染物浓度的吸收系数;PR(λ)为光通过距离L之后所接收到的功率(W);K(λ)为波长为λ的激光总消光系数;总的消光系数用Ksi描述;PO(λ)为激光的发射功率(W)。在实际计算中,式(1)可转化为式(2):
(2)
设不同种类土壤污染物浓度的数目用Ci描述;分别采用λoff、λon代表激光实时测量的土壤污染物浓度,Kai(λoff)和Kai(λon)分别表示土壤污染物浓度对应的弱吸收系数和土壤污染物浓度对应的峰值吸收系数,τ为2种波长的激光发射时间间隔,同时设置Kai(λon)-Kai(λoff)≈0得出式(3)[15]:
(3)
当T1=T2时,可选取适宜的光学系统和激光参数,当S(t)=S(t+τ)时2束激光共轴发射,简化式(3)后得出式(4):
=
(4)
当吸收系数的差值最大时,对其他土壤污染物浓度影响最小,由此得到式(5):
=exp[-L×(ΔKai×C)]
(5)
利用式(5)求解对数,激光路径里的平均土壤污染物浓度用式(6)表示:
(6)
设置样本数据维数为n,将土壤污染物浓度作为输入样本数据用Q=[q1, q2, …, qi, …, qm]表示,其中qi=[x1, x2, …, xi, …, xn]T,m表示样本数量,利用粒子表示自动编码机隐含层和输入层间的权值矩阵W1,如式(7)所示:
(7)
式中:q与n分别表示神经元个数与样本数据的维数。
Softmax回归模型可解决多分类问题。存在m个训练样本,{(x(1),y(1)),(x(2),y(2)),…,(x(m),y(n))}表示样本集合,存在k个类别标签,其中y=1,2,…,k。假设输入x时,样本被判断为类别j的概率用q(y=j|x)表示。用式(8)代表k类的分类器输出k维向量[16]:
(8)
式中:θ与k分别表示矩阵与矩阵参数总行数。分类器的代数函数为[17]:
(9)
存在某个指示性函数用1{y(i)=j}描述,当{y(i)=j}中值为真时,函数值为1,反之为0。利用梯度下降法最小化代价函数J(θ)对θj的偏导为[18]:
(10)
θj的更新公式为:
(11)
代价函数为
(12)
式中:权重衰减项用描述;权值衰减系数用ζ描述;J(θ)对θj的偏导得出式(13):
(13)
在代价函数达到极大值时可识别该样品的类别。
深度神经网络分类算法的构成是将Softmax分类器安装在自动编码机的顶层。再加入带有权重的Softmax分类器代价函数后,评价函数如式(14)所示:
B=ηSUMY(x,y)+μJ(θ)
(14)
式中:Softmax分类器代数函数的权重用μ描述;自动编码机误差函数用η描述,一般SUMY>J,η<μ。
为提升分类准确性,将带有权重的Softmax分类器代价函数带进误差函数中,求解逼近最优权值。最优权值求解:自动编码机的初始权值是按照评价函数筛选出粒子群内优秀的粒子M,通过式(14)求解出粒子的评价函数,按照评价函数值实施排序,粒子群算法的初始化粒子为前N个粒子,并权值优化利用粒子群算法实现,当评价函数在代价函数达到极大值时,实现自动编码机的训练,完成对相关土壤污染物浓度数据的分类。
(1) 收集被污染的土壤,并对土壤实行预处理操作,在风干室内,将潮湿土样倒入塑料膜上,用玻璃棒对其进行压碎、翻动,并均匀风干,再对风干土壤进行过筛,以剔除污染土壤中的固体杂质。
(2) 利用光谱技术检测土壤污染物浓度。即利用光谱仪采集土壤样本的光谱信息,将处理后的土壤划分为100均匀等份,从中随机抽取一份进行检测,在检测过程中,对检验样本进行3条光谱曲线扫描,取其平均值作为该样本的光谱数据,由此经光谱分析得到污染物浓度,将浓度作为输入向量,使用改进的深度学习网络训练输入样本,经分类器分类识别,实现最终土壤污染物浓度检测。
(3) 将获得的土壤污染物浓度作为特征向量,构成土壤环境污染物成分检测的学习样本集合。
(4) 利用粒子群算法优化后的深度神经网络学习土壤污染物检测训练样本集合,构建深度神经网络的土壤污染物检测模型,模型输出结果就是污染物检测结果。
以西北地区某区域作为研究对象,研究区域所属城市位于(36°03′N,103°40′E),深居西北内陆,海洋温湿气流不易到达,成雨机会少,大部分地区气候干燥,属大陆性很强的温带季风气候,年平均气温10.3 ℃,植被稀少且缺少水系。目前该区域面积约3 240 m2,由于农耕需求与工厂污染物排放,导致土壤中有机污染物与无机污染物严重超标,在已有研究中,有学者利用蛇形布点法,设10个污染物成分检测分点,再使用检测仪对10个分点进行检验,检测出该区域土壤中富含汞、砷、铊、钴、硒和铅等重金属以及由于农药残留导致的多氯联苯、多环芳烃等农药残留污染物,这些污染物不断向土壤内部渗入,长此以往很容易造成污染面积扩大,污染到周围水系和土壤。同时使用基于健康风险评价的土壤污染物检测方法(简称健康风险方法)[8]与基于风险管控的土壤污染物检测方法(简称风险管控方法)[9]作为对比方法。使用智能光谱采集仪获得的研究区域土壤光谱图如图2所示,由图2可知,该土壤波段急剧上升,形状陡峻,形成几个波折,之后逐渐上升,因此可以判定该地为陡坎型。
图2 近红外波段光谱图
Fig. 2 Near infrared spectrum
本文所使用的改进深度学习网络主要是通过分类实现土壤污染物检测,因此需要验证设计方法的性能,而本文所使用的验证方法是综合验证分类的召回率与准确率,而同时能够满足这2个内容的评价指标就是F1值,该值是准确率与召回率相乘的2倍除以准确率与召回率相加的值,F1值由可以划分为宏平均F1值与微平均F1值,这2个值能够分别描述不同种类的分类性能与整体分类性能,通常情况下,F1值越高,模型的分类效果越优[19-20]。对比3种方法在不同样本数量之下F1值的变化情况(图3)。由图3可知,无论何种条件下,本文方法始终能够随着样本数量的增加保持稳定趋势,同时整体F1值高于其他2种对比方法,微平均值最高可达0.48,宏平均值最高可达0.47,由此证明本文方法在实行样本分类时具有更好的分类结果和较高的分类准确性,为后续实验开展打下良好基础。这是因为本文将Softmax分类器引入该领域,利用Softmax分类器强大的分类优势提升检测质量,因此本文的分类准确性较高。
图3 F1值对比结果
Fig. 3 F1 comparison results
使用3种方法分别检测实验对象中各污染物含量,检测结果如图4所示。由图4可知,使用本文方法检测土壤中污染物含量的结果与使用化学仪器实际检测的结果最为接近,特别是汞、硒和铅等污染物含量的检测准确度可达到1,说明本文方法在检测土壤中污染物含量方面具有较高的准确性。这是因为本文方法在扫描土壤样本时,使用光谱仪器扫描土壤样品,再利用差分吸收光学光谱技术测量土壤环境污染物含量,保证了土壤样本的准确性,并且利用改进深度学习网络等方法提升污染物检测过程规范性,最大限度减少了意外情况干扰,因此准确度较高。
图4 土壤污染物含量检测
Fig. 4 Detection of soil pollutant content
对比3种方法的土壤污染物检测时间,结果如图5所示,由图5可知,另外2种方法最快可在1.73 min、1.57 min的时间内完成土壤污染物的检测,而本文设计方法能够在保证检测精度的基础上于1 min内完成相关检测,由此可以证明设计方法具有较强优势。这是因为本文引入多种算法,例如,粒子群算法和改进深度学习网络等,利用算法提升了土壤污染物检测的速度,因此具有较高的污染物成分检测速度。
图5 土壤污染物含量检测时间对比
Fig. 5 Comparison of detection time of soil pollutant content
验证3种方法的动态检测性能,针对土壤中的农药残留污染,分别使用3种方法检测土壤污染物近1年的浓度变化,检测结果如图6所示。由图6可知,经过长达1年的动态检测,本文方法检测2种土壤污染结果与实际检测结果始终保持一致,说明即使在动态检测情况下,本文方法始终具有较高的检测准确性,与同类方法相比具有较强优势,而风险管控方法和健康风险方法的准确率波动较大,误差最高可达到2.6 mg·m-3和4 mg·m-3。
图6 土壤污染物浓度检测
注:(a)多环芳烃检测结果;(b)多氯联苯检测结果。
Fig. 6 Detection of soil pollutant concentration
Note: (a) Detection results of polycyclic aromatic hydrocarbons; (b) Detection results of polychlorinated biphenyls.
目前土壤污染已对人们的生产生活产生了严重影响,为实现土壤环境中的污染物检测,本文将光谱技术引入该领域,提出了一种基于光谱技术的土壤环境污染物成分检测方法。首先使用光谱仪器扫描土壤样品,再利用差分吸收光学光谱技术测量土壤环境污染物含量,将该含量作为改进深度学习网络的输入向量;并结合粒子群算法与深度神经网络得到土壤污染物检测结果。经实际分析土壤样本对象,证明该方法具有较强的样本数据分类能力,在动态检测情况下具有较高的检测准确性,微平均值最高可达0.48,汞、硒和铅等污染物含量的检测准确度可达到1,证明了设计方法的有效性。本文研究可为提升土壤环境中的污染物检测效果提供一定帮助。
[1] 杨仁杰, 王斌, 董桂梅, 等. 基于二维相关荧光谱土壤中PAHs检测方法研究[J]. 光谱学与光谱分析, 2019, 39(3): 818-822
Yang R J, Wang B, Dong G M, et al. Detection of PAHs in soil based on two-dimensional correlation fluorescence spectroscopy [J]. Spectroscopy and Spectral Analysis, 2019, 39(3): 818-822 (in Chinese)
[2] 李爱民, 连增艳, 杨仁杰, 等. 基于三维荧光光谱直测土壤中的多环芳烃[J]. 环境化学, 2018, 37(4): 910-912
Li A M, Lian Z Y, Yang R J, et al. Direct determination of polycyclic aromatic hydrocarbons in soil based on three-dimensional fluorescence spectrum [J]. Environmental Chemistry, 2018, 37(4): 910-912 (in Chinese)
[3] 陈至坤, 郭蕊, 程朋飞. 基于激光诱导荧光的油类污染物检测系统研究[J]. 光散射学报, 2020, 32(1): 84-89
Chen Z K, Guo R, Cheng P F. Research on oil contaminant detection system based on laser induced fluorescence [J]. The Journal of Light Scattering, 2020, 32(1): 84-89 (in Chinese)
[4] 曹明月, 李贤, 黄好强, 等. 近红外光谱检测青贮饲料的营养成分[J]. 现代牧业, 2020, 4(1): 42-45
Cao M Y, Li X, Huang H Q, et al. Study on the nutritional components of silage with near infrared spectroscopy [J]. Modern Animal Husbandry, 2020, 4(1): 42-45 (in Chinese)
[5] 王翔, 赵南京, 俞志敏, 等. 土壤有机污染物激光诱导荧光光谱检测方法研究进展[J]. 光谱学与光谱分析, 2018, 38(3): 857-863
Wang X, Zhao N J, Yu Z M, et al. Detection method progress and development trend of organic pollutants in soil using laser-induced fluorescence spectroscopy [J]. Spectroscopy and Spectral Analysis, 2018, 38(3): 857-863 (in Chinese)
[6] 范俊楠, 郭丽, 张明杰, 等. 湖北省重点区域及周边表层土壤重金属污染现状及评价[J]. 中国环境监测, 2020, 36(1): 96-104
Fan J N, Guo L, Zhang M J, et al. Present situation and evaluation of heavy metals pollution in surface soils of key areas and surrounding areas in Hubei [J]. Environmental Monitoring in China, 2020, 36(1): 96-104 (in Chinese)
[7] Liu F, Wu H Y, Zhao Y G, et al. Mapping high resolution National Soil Information Grids of China [J]. Science Bulletin, 2022(3): 328-340
[8] 余璇, 吴劲, 宋柳霆, 等. 基于健康风险评价的土壤优先控制污染物筛选研究[J]. 环境污染与防治, 2018, 40(4): 473-478, 483
Yu X, Wu J, Song L T, et al. Priority control pollutants screening based on health risk assessment in soil [J]. Environmental Pollution & Control, 2018, 40(4): 473-478, 483 (in Chinese)
[9] 王琦, 李芳柏, 黄小追, 等. 一种基于风险管控的稻田土壤重金属污染分级方法[J]. 生态环境学报, 2018, 27(12): 2321-2328
Wang Q, Li F B, Huang X Z, et al. A classification approach of heavy metal pollution of paddy soil based on risk management [J]. Ecology and Environmental Sciences, 2018, 27(12): 2321-2328 (in Chinese)
[10] 曹冉, 孜比布拉·司马义, 斯琴. 乌鲁木齐市北郊农田土壤重金属污染及生态风险评价[J]. 河北农业大学学报, 2019, 42(3): 57-63
Cao R, Zibibulam Simayi, Si Q. Evaluation of heavy metals pollution and ecological risk of farmland soils in north Urumqi of Xinjiang [J]. Journal of Hebei Agricultural University, 2019, 42(3): 57-63 (in Chinese)
[11] 左兆陆, 赵南京, 孟德硕, 等. 基于迭代逼近算法的土壤中机油和柴油混合物荧光信号重叠特性研究(英文)[J]. 光谱学与光谱分析, 2020(1): 310-315
Zuo Z L, Zhao N J, Meng D S, et al. Study on the overlapping characteristics of fluorescence signals of machine oil and diesel mixtures in soil based on iterative approximation algorithm [J]. Spectroscopy and Spectral Analysis, 2020(1): 310-315 (in English)
[12] 李克伟, 凌永生, 张皓嘉, 等. 填埋场中有害元素成分原位检测方法[J]. 强激光与粒子束, 2018, 30(2): 135-141
Li K W, Ling Y S, Zhang H J, et al. In-situ detection method of harmful elements in landfill [J]. High Power Laser and Particle Beams, 2018, 30(2): 135-141 (in Chinese)
[13] Gupta T, Singh S P, Rajput P, et al. Introduction of measurement, analysis and remediation of environmental pollutants [J]. Energy, Environment, and Sustainability, 2020(1): 1-5
[14] Coster K, Adekunle A S, Mamba B B, et al. Electrochemical detection of environmental pollutants based on graphene derivatives: A Review [J]. Frontiers in Materials, 2021, 7: 616787
[15] Amine G M. Nanocomposites for electrochemical detection of environmental pollutants [J]. Micro and Nano Technologies, 2020, 1: 555-581
[16] 孔德明, 宋乐乐, 崔耀耀, 等. 结合平行因子分析算法和模式识别方法的三维荧光光谱技术用于石油类污染物的检测[J]. 光谱学与光谱分析, 2020, 40(9): 2798-2803
Kong D M, Song L L, Cui Y Y, et al. Three-dimensional fluorescence spectroscopy coupled with parallel factor and pattern recognition algorithm for characterization and classification of petroleum pollutants [J]. Spectroscopy and Spectral Analysis, 2020, 40(9): 2798-2803 (in Chinese)
[17] 赵静晓, 陈烽. 基于激光光谱技术的运动员大量运s动后气体成分检测[J]. 激光杂志, 2019, 40(12): 23-26
Zhao J X, Chen F. Detection of gas composition after massive exercise based on laser spectroscopy [J]. Laser Journal, 2019, 40(12): 23-26 (in Chinese)
[18] 周昆鹏, 刘双硕, 崔健, 等. 基于荧光发射光谱的水质化学需氧量的检测[J]. 光谱学与光谱分析, 2020, 40(4): 1143-1148
Zhou K P, Liu S S, Cui J, et al. Detection of chemical oxygen demand (COD) of water quality based on fluorescence emission spectra [J]. Spectroscopy and Spectral Analysis, 2020, 40(4): 1143-1148 (in Chinese)
[19] 王照国, 张红云, 苗夺谦. 基于F1值的非极大值抑制阈值自动选取方法[J]. 智能系统学报, 2020, 15(5): 1006-1012
Wang Z G, Zhang H Y, Miao D Q. Automatic selection method of non-maximum suppression threshold based on F1 score [J]. CAAI Transactions on Intelligent Systems, 2020, 15(5): 1006-1012 (in Chinese)
[20] 杨红梅, 李琳, 杨日东, 等. 基于双向LSTM神经网络电子病历命名实体的识别模型[J]. 中国组织工程研究, 2018, 22(20): 3237-3242
Yang H M, Li L, Yang R D, et al. Named entity recognition based on bidirectional long short-term memory combined with case report form [J]. Chinese Journal of Tissue Engineering Research, 2018, 22(20): 3237-3242 (in Chinese)