摘要
目的 为了在有限样本下,提升机器学习模型挖掘数据特征的能力,提高模型预测精度,方法 选取四川省雅砻江和大渡河中下游省级水土流失重点预防区九龙县、康定市、泸定县和木里县为研究区,选择12个影响因子构建滑坡易发性评价指标体系,使用确定性系数(certainty factor,CF)量化评价指标,对比逻辑回归(logistic regression,LR)和支持向量机(support vector machine,SVM)模型,在表现最优的模型上添加降噪自编码器(denoising autoencoder,DAE)和卷积自编码器(convolutional auto-encoders,CAE),并对比各模型提取数据特征。结果 结果表明:与CF-LR模型和CF-SVM模型相比,CF-SVM模型的精确率(P)、F-measure、Kappa系数、总准确度(OA)和AUC相较于CF-LR模型的分别提高了31.9%,1.1%,17.1%,8.5%,8.6%;添加DAE编码器后,CF-SVM-DAE模型的召回率(R)、F-measure、Kappa系数和总准确度(OA)相比于CF-SVM模型分别提高了8.1%,5.8%,8.1%,4%;添加CAEs编码器后,CF-SVM-CAEs模型的召回率(R)、F-measure、Kappa系数和总准确度(OA)相比于CF-SVM模型分别提高了0.4%,0.2%,0.2%,0.1%。结论 选用的机器学习方法中,CF-SVM模型预测精度更高。在CFSVM模型基础上添加DAE编码器比添加CAEs编码器鲁棒性更好,因此,CF-SVM-DAE模型在所有模型中表现最好,更适合当前研究区域。