基于PLSR和LSSVM模型的土壤水分高光谱反演
刘英1,2, 范凯旋1, 裴为豪1, 沈文静1, 葛建华1
作者简介
刘英,男,安徽安庆人,安徽理工大学地球与环境学院,讲师,硕士生导师,主要从事矿山环境监测与生态修复方面的研究工作。近3年主持国家自然科学基金青年基金项目、安徽省教育厅重点项目、煤炭开采水资源保护与利用国家重点实验室开放基金项目、中国矿业大学博士创新专项基金项目各1项,参与了国家重点基础研究发展计划、国家重点研发计划项目课题、国家自然科学基金联合基金重点项目、中国工程院战略咨询项目、国家自然科学基金面上项目、安徽省重点研究与开发计划等项目的研究工作。发表学术论文30余篇,授权发明专利1件,获省部级科技奖1项。Science of the Total Environment、Biosystems Engineering、Ecological Indicators、Ecological Engineering、Land、Environmental Earth Sciences、Restoration Ecology、矿业安全与环保等多个期刊审稿人。
扫码阅读全文
摘要
为对地下采矿扰动区表层土壤水分进行反演,以大柳塔煤矿52501工作面为例,利用无人机搭载成像光谱仪获取高光谱影像,对获取的光谱数据进行对数、倒数对数、一阶和包络线去除变换,结合地面采集的128个土壤水分数据,基于偏最小二乘回归(PLSR)和最小二乘支持向量机(LSSVM)构建土壤水分预测模型并验证其预测精度。结果表明,基于一阶变换的PLSR模型和LSSVM模型预测精度相对较好,一阶变换的PLSR模型建模集Rc2和预测集Rp2分别为0.702 1和0.640 5,均方根误差RMSEc和RMSEp分别为1.638 4%和1.103 4%,相对分析误差RPDp为1.726 3;一阶变换的LSSVM模型建模集Rc2和预测集Rp2分别为0.812 5和0.597 9,均方根误差RMSEc和RMSEp分别为1.275 5%和1.345 9%,相对分析误差RPDP为1.632 3。最终基于PLSR和LSSVM模型完成了土壤水分的制图,实现了土壤水分的空间预测,为该研究区植被引导修复中土壤水分精准提升提供了空间数据支持。
主要内容
以大柳塔煤矿52501工作面为例,利用无人机获取研究区域的高光谱影像,通过野外实地同步采集的不同水分含量土壤样本,采用PLSR和LSSVM方法建立研究区土壤水分含量的高光谱预测模型并进行精度验证,对研究区土壤水分进行反演并制图,以期为该矿区煤炭地下开采受损植被引导修复中土壤水分精准提升提供空间数据支持。
1. 材料与方法
1.1 研究区域概况
图 1 研究区位置及采样点分布
1.2 土壤样本采集及含水量测量方法
本次共选取128个点位进行土壤样本采集,样本含水量为5.60%~17.50%,平均为9.42%,采样时间为2021年8月。在提前布设好的采样点区域采集深度0~20 cm土层样本,将样本带回实验室采用烘干法测量土壤水分。经测量,部分采样点土壤含水量相同,相同含水量采样点的光谱反射率取平均值,最终得到58个样本数据。1.3 无人机监测方案
使用大疆如风4无人机搭载成像光谱仪SPECIM FX10获取研究区机载高光谱影像,共包括112个波段,波段范围为398.97~1 002.40 nm,与土壤样本采集在同时间段内完成。工作面形状类似长方形且地貌简单,无人机沿工作面方向飞行,飞行高度为100 m,无人机的航向和旁向重叠度分别设置为70%、60%,高光谱影像的光谱分辨率为5.5 nm,空间分辨率为0.16 m。通过扫描的方式完成对整个区域的拍摄。
1.4 影像预处理
使用SPECIM公司研发的CaliGeoPro工具进行辐射定标和地理定位,将原始高光谱的DN值转化为辐亮度,采用Pix4D Mapper 2.0无人机图像专业处理软件对获取的无人机高光谱数据进行配准,利用同步获取的白板平均光谱将高光谱影像的辐亮度转换为反射率数据,采用基于地理参考匹配的镶嵌方法对各条航带进行拼接。由于野外采集的光谱影像会存在光谱噪声,光谱影像会产生“毛刺”现象[11],对采集的高光谱影像进行SG(savitzky-golay smoothing)光谱平滑处理。对平滑后的高光谱各波段反射率值(R)进行数学变换,能够放大光谱特征峰的值,提高反演模型的精度[12]。本次研究采用一阶微分(First Derivative,FD)、倒数对数(lg(1/R))、对数(lg R)和包络线去除(CR)4种变换方法,对原始光谱进行变换。对数变换后光谱曲线与原始光谱曲线对称,总体光谱曲线比较平滑,曲线的拐点波段区间基本一致。而经过FD和CR变换后,光谱波动相对剧烈,特征峰谷数量变多,对比更加明显。其中包络线去除在Envi 5.6中完成,一阶微分、对数和倒数对数在MATLAB软件中完成计算。
1.5 模型建立与验证
采用偏最小二乘回归(PLSR)和最小二乘支持向量机(LSSVM)方法构建土壤水分反演模型。PLSR模型的稳健性在于主成分个数的确定,采用交叉验证的方法来选取最佳主成分的个数,可以避免出现过拟合和欠拟合的问题[13]。LSSVM模型正则化参数(γ)和核函数参数(δ2)的选取会直接影响模型的拟合能力,采用网格搜索法和交叉验证法来选择最优的参数组合可以有效提高模型预测的精度[14]。
采用决定系数(Coefficient of Determination,R2)、均方根误差(Root Mean Square Error,RMSE)和相对分析误差(Relative Percentage Difference,RPD)3个参数对模型进行稳定性和预测精度评价,建模集以Rc2、RMSEc作为评价指标,验证集采用Rp2、RMSEp、RPDp来评价。Rc2和Rp2越高、RMSEc和RMSEp越小,则模型的反演精度越高,稳定性越好。当RPD>3.0时,表明模型能够进行精准预测;当2.0 < RPD≤3.0时,表明反演模型能够进行较准确预测;当1.5≤RPD≤2.0时,说明模型只能够进行粗略预测[15]。
2. 结果与分析
2.1 土壤水分样本集的划分及统计特征
表 1 土壤样品SMC的特征统计
2.2 土壤光谱曲线特征分析
图 2 不同水分含量土壤反射光谱及光谱变换曲线
2.3 不同光谱预处理方法的建模与分析
表 2 不同光谱预处理方法的PLSR和LSSVM模型建模与预测结果
图 3 基于PLSR和LSSVM模型的SMC建模集和预测集散点图
由图 3可以看出: PLSR模型建模集和预测集的SMC实测值与预测值回归方程斜率分别为0.70、0.64,截距分别为2.89、3.21;LSSVM模型建模集和预测集的SMC实测值与预测值回归方程斜率分别为0.69、0.54,截距分别为2.88、4.04。回归方程的斜率越接近1,截距越小,说明实测值与预测值越接近[18]。
2.4 土壤水分的反演制图
图 4 基于PLSR和LSSVM模型的研究区土壤水分反演图及不同含水率区间面积占比统计图
3. 讨论
图 5 基于PLSR和LSSVM模型的植物受干旱胁迫和死亡胁迫空间分布图
由图 5可知,LSSVM模型反演的植物受死亡胁迫区域比PLSR模型表现更明显,分别仅占研究区域面积的5%、1%,说明植物受死亡胁迫区域较小,主要分布在研究区东南部。PLSR模型和LSSVM模型反演的植物受干旱胁迫区域分布区间基本一致,面积分别占14%、16%,主要分布在研究区东半部分。由于图中植物受干旱区域距离采动地裂缝较近,土壤水分流失更为严重。极少区域植物会受到死亡胁迫,少部分区域植物会受到干旱胁迫,土壤水分反演图可清晰显示植物受到死亡胁迫和干旱胁迫区域,为矿区植被引导型修复提供了修复方向和数据支持。4. 结论
通过对比光谱不同变换方法与PLSR、LSSVM模型组合下的土壤水分预测精度,原始光谱经FD变换后,2种模型预测表现最好。基于FD变换的PLSR模型Rc2和Rp2分别为0.702 1、0.640 5,RMSEc和RMSEp分别为1.638 4%、1.103 4%,RPDp为1.726 3。基于FD变换的LSSVM模型Rc2和Rp2分别为0.812 5、0.597 9,RMSEc和RMSEp分别为1.275 5%、1.345 9%,RPDp为1.632 3。对比发现基于FD变换的PLSR模型预测结果最优。
对大柳塔矿区52501工作面进行土壤水分预测并进行空间制图,土壤水分的分布差异可以通过不同的颜色清晰地反映在图中,并单独提取出植物受死亡胁迫和受干旱胁迫区域,从而清晰地显示出不同区域植物缺水情况,为矿区植被修复策略的制订提供空间数据支持。结果表明,利用无人机采集的高光谱影像对矿区土壤水分进行预测是可行的,该方法可有效、快速地监测矿区土壤水分,遵循了矿区煤炭井工开采受损植被引导型修复的理念。
刘英, 范凯旋, 裴为豪, 沈文静, 葛建华. 基于PLSR和LSSVM模型的土壤水分高光谱反演[J]. 矿业安全与环保, 2024, 51(5): 147-153.
LIU Ying, FAN Kaixuan, PEI Weihao, SHEN Wenjing, GE Jianhua. Hyperspectral inversion of soil moisture based on PLSR and LSSVM models[J]. Mining Safety & Environmental Protection, 2024, 51(5): 147-153.
END
供稿:陈玉涛
审核:熊云威