面向不平衡数据集的矿井通风系统智能故障诊断
深入分析了实际工况下不平衡数据集对故障诊断模型的影响,并根据数据存在样本不平衡性的特点,有针对性的提出一种故障诊断方法。对原始样本通过WGAN-div模型进行数据增强处理,创新性的在WGAN-div模型中加入了残差块,有效提高了数据生成质量;选择了适合于通风系统高维多分类的集成学习模型;以东山煤矿为对象分别进行了不同数据增强模型、不同分类模型以及不同数据生成率下的对比实验,引入了多种评价指标及t-SNE可视化对模型进行评估,确定了WGAN-div数据增强的有效性以及RF分类模型的有效性。本文所提模型有效解决了不平衡样本集下的故障诊断问题,可及时准确的发现通风系统故障位置,为智能诊断技术真正应用到矿井提供技术支撑。
作者:赵 丹1, 2 , 沈志远1, 2 , 宋子豪1, 2单位:1. 辽宁工程技术大学 安全科学与工程学院;2. 辽宁工程技术大学 矿山热动力灾害与防治教育部重点实验室如何及时准确的判断故障的位置,已成为煤矿亟待解决的一个难题。随着煤矿智能化建设的发展, 应用机器学习算法实现通风系统的智能故障诊断,助力矿井通风智能化管理是研究的关键。随着大数据、工业互联网、人工智能等技术的发 展,故障诊断技术在电网、机械设备、航空航天等不同工程领域应用成熟。2018 年,刘剑等以风量作为输入特征,应用支持向量机 (Support Vector Machine,SVM) 算法确定了矿井通风系统故障位置及故障量,这开创了应用机器学习进行矿井通风系统故障诊断的先河,2020 年应用遗传算法构建了矿井通风系统故障诊断无监督模型,无需样本参与训练,有效提升了诊断性能;HUANG等利用卡尔曼滤波模型对矿井监测风速数据进行了预处理,并提出了基于 混合编码算法的矿井通风系统无监督学习故障诊断 模型,实现了故障位置和故障量的同时诊断;周启超等基于改进的遗传算法对矿井通风系统故障诊断SVM模型的参数进行了优化研究,有效避免了模型易出现过拟合的问题;倪景峰等提出了基于随机森林和决策树的通风系统故障诊断方法,并证实了随机 森林模型优于决策树模型;张浪等选择了SVM、神经网络和随机森林 (Random Forest,RF)3 种矿井通风系统故障诊断机器学习算法进行对比分析,结果表明 神经网络模型具有更高的准确率;ZHAO等以大明矿为研究对象,在构建的故障巷道范围库内应用改进的SVM算法进行通风系统故障诊断,缩减了故障定 位的范围,提高了样本训练效率;WANG等构建了基于多标签K-近邻 (Multi-label K-Nearest Neighbor, ML-KNN) 的机器学习模型,解决了矿井通风系统多个位置发生故障时的快速诊断问题;LIU等应用4种机器学习算法:K-近邻 (K-Nearest Neighbor,KNN)、 多层感 知 机 (Multilayer Perceptron,MLP)、 SVM和决策树 (Decision Tree,DT) 对矿井通风系统故障诊断模 型性能进行了充分评价,确定了 KNN 模型和DT模型的优越性。虽然机器学习算法在矿井通风系统故障诊断中表现优异,但目前的矿井通风系统故障诊断模型的建立都是在数据集较为完备的前提下进行的。 但是,在实际的通风系统故障情形下,完备的数据集条件是不能满足的。机器学习分类器高度依赖完备的样本集,不平衡的样本集训练出的模型通常不具有参考意义。如何在样本不平衡情况下开展故障诊断是一个严峻的挑战。机器学习领域的学者们通常从算法层面和数据层面解决不平衡数据的分类问题。 文献从算法层面出发构建了单分类支持向量机 (One-Class SVM,OCISVM) 与增量学习 (Incremental Learnin-g,IL) 相结合的通风系统故障诊断模型,但是 该方法依赖于特定算法,导致适用性较差。鉴于此,笔者从数据层面和网络体系层面开展不 平衡数据集的通风系统故障诊断研究,构建了基于 Wasserstein 距离的生成对抗网络 (Wasserstein diver- gence for GANs,WGAN-div), 创 新 性 地 在 WGAN-div 模型中加入残差块实现原始数据增强处理,重构平衡 数据集。结合集成学习中的投票机制实现通风网络 分支故障诊断,确定了 RF 模型在通风系统故障诊断 中的优越性。有效解决了实际工况下样本不平衡的 故障诊断问题,为智能诊断技术真正应用到矿井提供 技术支撑。及时准确判断故障分支的位置对保障矿井通风系统的可靠性和安全性意义重大。针对实际 工况下,矿井通风系统故障样本数据存在不平衡性,导致传统的机器学习模型诊断能力与泛化能力差的问题,提出了一种面向通风系统不平衡数据集的 WGAN-div-RF 故障诊断模型。以简单通风网络为例构造了不平衡比分别为 2∶1、5∶1、10∶1、20∶1 的故障数据集,深入分析了不平衡 样本集对通风系统故障诊断的影响。搭建了基于 Wasserstein 距离生成对抗网络 (WGAN-div) 对不 平衡数据集进行数据增强处理,在构建网络时创新性地加入了残差块,提高了生成数据的质量, 实现原始样本的有效扩充。结合集成学习中的随机森林 (RF) 模型实现通风系统故障分支诊断。以 东山煤矿通风系统为实验对象,分别进行了不同数据增强模型、不同分类模型以及不同数据生成 率下的故障诊断对比实验,以多种评价指标及 t-SNE 可视化对模型有效性进行评估。结果表明: 加入残差块的 WGAN-div 模型生成数据与真实数据具有很好的相似性,相较于GAN模型、 WGAN模型和 WGAN-gp 模型,WGAN-div 模型更具优越性;应用 WGAN-div 模型进行数据增强 后,机器学习分类模型的性能提升明显;当扩充数据集达到平衡时,与其他集成模型及常用的矿 井通风系统故障诊断 SVM 模型相比,RF 模型在 Re、Pr、Gmean 和 F1 指标上均占优势。图 1 数据不平衡示意
图 2 GAN 模型基本结构
图 3 残差块示意
图 4 WGAN-div-RF 模型构架
图 5 简单通风网络
图 6 简单通风网络故障诊断实验混淆矩阵
图 7 简单通风网络不平衡数据集故障诊断实验评价指标
图 8 东山矿通风网络
图 9 t-SNE 降维数据可视化
图 10 WGAN-div 损失函数
图 11 不同数据生成比率下各分类模型的实验结果
赵丹,女,1982年2月6日生,辽宁阜新人,教授,博士生导师,《煤炭学报》青年编委,中国职业安全健康协会通风安全与健康专业委员会青年常务委员,中国煤炭工业安全科学技术学会矿井降温专业委员会委员,国家二级安全评价师。主持国家自然科学基金项目2项,主持省级项目2项,获省部级科技奖励3项,省级教学成果一等奖1项。以第一作者发表学术论文50余篇。成果《矿井降温与空气调节》获得辽宁省优秀教材奖和第三届煤炭行业优秀教材一等奖。
研究方向
矿井通风与降温
主要成果
致力于矿井通风故障诊断理论及技术的研究,取得多项创新性成果,形成了矿井通风故障诊断成套技术体系,为矿井智能通风提供理论基础,达到监测数据的有效利用,实现关口前移和灾前预测预报。
来源:
赵丹,沈志远,宋子豪. 面向不平衡数据集的矿井通风系统智能故障诊断[J]. 煤炭学报,2023,48(11):4112−4123.
特别声明:
本文转载仅仅是出于传播信息的需要,并不意味着代表本网站观点或证实其内容的真实性;如其他媒体、网站或个人从本网站转载使用,须保留本网站注明的“来源”,并自负版权等法律责任;作者如果不希望被转载或者联系转载稿费等事宜,请与我们接洽。
更多精彩内容,关注“传煤”微信公众号,或点击“期刊群”免费获取科研论文
用微信扫描左侧二维码,关注“传煤”公众号,第一时间获取煤炭行业新鲜资讯,享全方位煤炭科技知识信息服务。