一
研究背景
回采工作面是矿井瓦斯涌出的主要场所,精准预测回采工作面的瓦斯涌出量,进而有针对性地提出防治措施,对保证矿井安全生产具有重要意义。随机森林回归算法能够处理高纬度的离散型及连续性数据,具有较强的抗噪声能力和准确性,同时理论易于理解,计算简单,故也被应用于工作面瓦斯涌出预测中。本文以工作面实测瓦斯涌出量数据为原始样本,通过Bootstrap抽样方法进行样本选取,以袋外数据(OOB)作为测试集,通过袋外数据评估分数oob_score进行模型参数调优,建立最优化的随机森林回归模型,进行回采工作面的瓦斯涌出量预测,从而提高预测精度及预测效率。
二
研究内容
1 随机森林回归算法
随机森林回归算法的基本思想:首先,利用 Bootstrap 抽样方法从原始训练集中抽取 k 个与原始训练集样本容量一致的样本;其次,针对 k 个样本,从 M 个输入特征中随机选择 m 个作为决策树分支节点的备选特征(M >m);然后,根据特征不纯度指标确定最佳节点和最佳分支,分别建立 k 个决策树回归模型,得到 k 个回归预测结果;最后,根据 k 个回归预测结果求得平均值 P,作为最终预测结果。
2 数据样本
影响工作面瓦斯涌出量的因素众多,根据资料查阅及现场考察,选取14种特征,包括瓦斯含量X1、煤层埋深X2、开采层厚度X3、煤层倾角X4、回采高度X5、日进尺X6、工作面长度X7、采出率X8、日产量X9、顶板管理方式X10、邻近层瓦斯含量X11、邻近层煤层厚度X12、邻近层与本煤层间距X13、邻近层与本煤层层间岩性X14。进行重要性评估,得到各种特征的重要性占比。
3 模型构建与参数调优
随机森林回归模型以Python语言为基础,借助Sklearn机器学习中的RandomForestRegressor进行构建。Sklearn中随机森林回归模型的待调参数共有16项。主要待调参数如下。调参结果表明,当criterion为mae,n_estimators为20,max_features为14,random_state为70时,根据数据样本所建立的随机森林回归模型obb_score最大,为0.921 164 29。
三
测试结果
测试结果表明,当特征变量个数为 3 或 4 时,虽然在训练集中的 obb_score 均大于 0.94,但在测试集中平均绝对误差和平均相对误差均相对较大,说明当特征变量个数为 3 或 4 时,存在一定过拟合。当特征变量个数为 14 时,平均绝对误差仅为 0.005 m³/min,平均相对误差仅为 0.77%,预测效果最好。
将特征变量为14时建立的工作面瓦斯涌出量随机森林回归模型与主成分回归分析法进行对比。结果表明,随机森林回归模型最小相对误差为1.63%,最大相对误差为5.97%,平均相对误差为4.26%,具有较高的准确性,完全能够满足现场瓦斯涌出量预测需求。与主成分回归分析法相比,随机森林回归模型的平均相对误差降低了14.29%,预测效果更好。
作者简介
张增辉(1987—),男,河南西华人,工程师,硕士,研究方向为井工煤矿灾害治理,E-mail:544396324@qq.com。
引用格式
张增辉,马文伟. 基于随机森林回归算法的回采工作面瓦斯涌出量预测[J]. 工矿自动化,2023,49(12):33-39.
ZHANG Zenghui, MA Wenwei. Prediction of gas emission in mining face based on random forest regression algorithm[J]. Journal of Mine Automation,2023,49(12):33-39.
扫码阅读全文