为解决矿井通风参数在实际测量中存在的数据缺失问题,提出了1种基于随机森林—链式方程多重插补法的矿井通风参数缺失数据填补方法。在经典多重插补法的基础上,使用具有高效、准确的链式方程对初始填补后的完整数据集进行迭代,提高了填补精度。考虑到矿井通风系统中缺失数据的不确定性,使用随机森林预测均值匹配模型对缺失值进行预测填补。模型可以自主学习参数之间的相关性,轻松处理混合型数据,做到了对缺失数据的“黑盒”填补,并具有一定的稳定性。
长按识别二维码阅读全文
矿井通风参数缺失数据插补方法
矿山智能化建设离不开矿井智能通风,通风系统的智能化、信息化是保障我国煤炭工业转型升级和高质量发展的核心技术之一。完整、准确的矿井通风参数是对矿井智能通风系统进行通风网络解算、通风状态分析、异常或灾变智能决策的重要数据支撑。矿井通风参数包括风速、风量、风压、风阻、巷道断面积、干湿温度等,然而,在井下实际测量时,经常因为仪器受到干扰、巷道断面风速不均一、人工操作不当、巷道环境恶劣等制约性因素,导致矿井通风参数存在数据缺失或数据质量下降的现象。经实际测量发现,常见易缺失的参数包括巷道断面积、风量、风阻等。存在缺失的参数一方面无法准确反映矿井通风系统的工作状态、无法对通风系统进行状态分析,另一方面会导致煤矿通风工作人员无法对通风设施进行修改、维护,影响其对通风系统的运维决策。为解决上述问题,对矿井通风参数的缺失数据进行插补至关重要。
大多数统计分析方法都需要完整的数据集,但在几乎所有的研究中都存在数据缺失现象。常规的补全方法有均值填充法、众数填充法、函数逼近法、期望最大化算法、最近邻插补法、多重插补法、机器学习模型预测插补法等方法。关于矿井通风参数缺失数据插补方面,目前有对矿井通风摩擦阻力系数预测的一些研究。刘泽功利用通风阻力测定数据和分支风量结合起来求算复杂通风网络分支风阻,并给出了具体的测算步骤和测算数据。司俊鸿等针对复杂通风网络易构造病态测风求阻模型的问题,提出了基于贪婪进化算法的Tikhonov正则化参数求解方法,对模型进行修正处理。邓立军基于最小二乘原理,综合考虑压力、风量以及通风阻力系数范围约束,将通风阻力系数反演问题转化非线性优化问题,最终提出了一种基于反映通风系统阻力系数变化的巷道风量测点和节点压力测点布置方法。刘剑等理论分析了矿井定常湍流对通风阻力测试的影响。李雨成等研究了基于节点压能的风量反演风阻算法,提出使用2组风量数据及部分节点压能数据反演风阻。机器学习算法在摩擦阻力系数的预测中已有一定的研究,通过机器学习与缺失值插补算法结合的方法直接对矿井通风参数进行插补的研究还较为少见。
矿井智能通风系统对矿山智能化建设至关重要。为解决矿井通风参数在实际测量时,因为巷道不具备测试条件、仪器信号受到干扰、巷道断面风速不均一、人工操作不当等制约性因素,造成的矿井通风参数数据缺失问题,提出了1种基于随机森林−链式方程多重插补法的矿井通风参数缺失数据插补方法。采用链式方程多重插补法,通过迭代对每个缺失的属性值产生n个插补值,从而产生n个完整数据集,对n个完整数据集进行分析优化得到1个最终的完整数据集。为了提高缺失值插补精度,合理考虑了矿井通风参数缺失数据的不确定性对分析过程的影响,在随机森林的预测任务中,结合预测均值匹配模型对缺失数据进行插补。
以潞新二矿为实验对象,利用智能矿井通风仿真系统IMVS对潞新二矿矿井通风参数原始数据集进行数据预处理,得到完整、准确的矿井通风参数完整数据集,对完整数据集分别进行了不同缺失属性、不同数据缺失率、不同迭代次数的对比试验。以多种模型评价指标对模型有效性进行评估。结果表明:基于随机森林的链式方程多重插补模型插补形成的完整数据集与原始数据集具有很好的相似性;对不同缺失列进行插补实验的结果显示插补模型可以轻松处理混合类型的数据,自主学习参数之间的相关性从而降低了插补复杂性;迭代后形成的n个数据集通过分析合并成一个最终数据集,提高了插补准确率;对初始插补后的完整数据集进行不同迭代次数的试验,发现迭代超过一定次数后,数据相关性一定会收敛。
图 1 基于多重插补法的不完整数据集插补过程
图 2 基于随机森林的链式方程多重插补法
图 3 基于随机森林的预测均值匹配过程
图 4 矿井通风参数缺失数据插补流程
图 5 模型 1、2 数据集合并前后插补效果
图 7 均值收敛示意
倪景峰,男,1975年1月生,河北人,教授,辽宁工程技术大学通风安全研究院院长,中国煤炭学会煤矿安全专业委员会第八届委员,中国职业健康协会通风安全与健康专业委员会第一届委员会常务委员,神华神东煤炭集团有限责任公司应急专家库专家。获国家安监局、山西省、河南省、煤炭工业学会等奖励10余项,2011年入选辽宁省第六批百千万人才工程千人层次。
研究方向
矿井通风(智能通风)
主要成果
开发的矿井通风智能决策仿真系统(IMVS)、矿井通风管理信息系统(MVIS)、矿井通风仿真系统(MVSS3.1,MVSS2008/3D.NET)等通风仿真决策类软件,是利用矿井通风仿真技术和计算机网络技术开发出的矿井通风专业化软件。经过二十多年的不断完善,解决了一系列算法与技术难题,目前已形成功能强大、操作方便、易于应用推广的智能通风仿真类软件,为矿井通风优化与设计提供技术支持。该类软件已在国家能源投资集团神东煤炭分公司、中国中煤能源集团有限公司-西北能源公司、铁煤集团、沈煤集团、鸡西矿业集团、双鸭山矿业集团等超过100个矿井进行应用。
来源:
倪景峰,刘雪峰,邓立军. 矿井通风参数缺失数据插补方法[J]. 煤炭学报,2024,49(5):2315−2323.