-
作者
翟小伟罗金雷张羽琛宋波波郝乐周妤婕
-
单位
西安科技大学安全科学与工程学院西安科技大学陕西省煤火灾害防控重点实验室陕西高校青年创新团队矿山应急救援创新团队
-
摘要
现有煤自燃温度预测模型的建立大多基于较为完整的指标气体样本数据,但指标气体数据受仪器或人为因素影响,往往存在数据缺失现象,导致煤自燃温度预测准确率较低和过拟合等问题。针对上述问题,提出了将K近邻算法(KNN)、随机森林(RF)、决策树(DT)及基于粒子群优化的支持向量回归等填补算法(PSO-SVR)应用于缺失值填补,缺失数据和填补后的数据通过RF、SVR和极限梯度提升树(XGBoost)算法分别进行训练,并通过PSO算法优化参数,构建了基于数据填补的RF、XGBoost和SVR煤自燃温度预测模型。利用煤自然发火实验选取CO,CO2,CH4,C2H6,O2作为指标气体,并设计整体缺失率为10%,20%,30%和CO,CO2缺失率为40%,50%,60%共6种随机数据缺失,采用平均绝对误差百分比(MAPE)作为填补效果评价指标,采用MAPE、判断系数R2和均方根误差(RMSE)作为模型性能评价指标,对4种填补算法和3种预测模型进行对比。对比分析结果表明:在6种数据缺失情况下,DT填补算法填补效果优于其他3种算法,在CO,CO2存在较多缺失值时,RF算法的填补值与实际值的MAPE偏大;在不调参的情况下,XGBoost模型虽然在训练集效果极好,但极易过拟合,而SVR模型预测效果极差,无法满足预测要求;在6种数据缺失情况下,基于DT填补算法的PSO-SVR、RF与PSO-RF煤自燃温度预测模型的MAPE均在4%左右,基于DT填补算法的RF模型无需优化就能较好地预测出煤自燃温度,具有良好的稳定性。
-
关键词
煤自燃温度预测指标气体数据缺失填补K近邻填补算法随机森林填补算法决策树回归填补算法基于粒子群优化的支持向量回归填补算法
-
基金项目(Foundation)
国家自然科学基金项目(51974236);陕西省自然科学基础研究计划项目(2021JC-48);陕西省教育厅青年创新团队建设科研计划项目(21JP078);
-
文章目录
0 引言
1 填补算法与策略
1.1 填补算法
1.1.1 KNN算法
1.1.2 DT算法
1.1.3 RF算法
1.1.4 PSO-SVR算法
1.1.5 XGBoost算法
1.2 填补策略
2 基于数据填补的煤自燃温度预测模型构建
3 指标气体数据获取与缺失值设计
3.1 煤自燃发火实验
3.2 缺失值设计
4 填补效果与模型对比分析
4.1 模型评价指标
4.2 填补算法效果对比分析
4.3 模型精度对比分析
4.4 PSO优化参数后模型性能对比分析
5 结论
-
引用格式
翟小伟,罗金雷,张羽琛,宋波波,郝乐,周妤婕.基于数据填补的煤自燃温度预测模型[J].工矿自动化,2023,49(01):28-35+98.DOI:10.13272/j.issn.1671-251x.2022090032.
-
相关专题