一
研究背景
煤矿工业物联网(IIoT)设备受自身设计和性质限制,通常为计算与存储资源受限设备,难以采用强密码协议与复杂的认证机制进行安全防护,攻击者通过分析网络通信流量,对特定漏洞设备发起针对性网络攻击,可能造成敏感数据泄露或恶意篡改,严重威胁煤矿IIoT的安全稳定。精准识别煤矿IIoT设备可完善煤矿设备资产信息库,有效管理并维护设备正常运转,为提高设备的安全防护能力提供依据。现有设备识别算法存在特征构造复杂、内存与计算需求较高导致难以部署在资源受限的煤矿IIoT设备中等问题。本文利用轻量化神经网络方法,提出了一种煤矿IIoT设备识别模型。
二
煤矿IIoT设备识别模型
煤矿IIoT设备识别模型分为原始流量切分与截取、Non−IIoT设备过滤、偏移流量数据平衡、煤矿IIoT设备识别4个部分,如下图所示。
1) 原始流量切分与截取。将支持TCP/IP协议传输的流量数据切分为双向会话流,去除会话流中无关MAC/IP地址字段,并删除会话流中应用层空/重复文件,将每个会话流截取定长字段后转为IDX格式进行存储。
2) Non−IIoT设备过滤。利用轻量级深度可分离卷积(DSC)替代传统卷积提取流量特征,结合卷积块注意力模块(CBAM)校正通道、空间权重,搭建DSC−CBAM模型(如下图所示)过滤Non−IIoT设备。
3) 偏移流量数据平衡。采用带有阶段惩罚的Wasserstein生成对抗网络(WGAN−GP)模型平衡流量较少类煤矿IIoT设备流量数据,将平衡后数据并入原有设备数据集中共同作为煤矿IIoT设备增强数据集。
4) 煤矿IIoT设备识别。引入多尺度特征融合(MFF)技术与Mish激活函数优化DSC−CBAM模型,构建优化混合模态识别(MDCM)模型(结构见下表)。将经过平衡后的数据输入MDCM模型,实现煤矿IIoT设备精准识别。
三
实验分析
1.消融实验
通过消融实验验证MDCM模型中DSC,CBAM,MFF,Mish对优化煤矿IIoT设备识别效果的有效性,结果如下图所示。CNN模型收敛速度中等,各评价指标保持在99.960%左右,但参数量高达228 318个,模型复杂度较高;DSC模型参数量为CNN模型的16.6%,精确率、召回率等略有损失,表明DSC确实会破坏卷积核与输出通道的相互作用,但各项评价指标仍能保持在99.955%以上;DSC−CBAM模型收敛速度慢于CNN模型,除参数量略增大外,其他各项评价指标均优于上述模型,表明采用CBAM校正特征权重可极大提升模型识别性能;MDC模型收敛速度进一步加快,各项评价指标显著提升至99.970%以上;MDCM模型收敛速度最快,准确率、召回率、精确率与F1−score指标均最优,高达99.975%以上,而参数增加量几乎可忽略不计。
2.模型对比实验
为验证本文所提设备识别模型的优越性,在UNSW数据集上与文献[6] 、文献[10]、文献[11]、文献[34]中所提模型进行对比,结果见下表。文献[6]构建ML模型识别设备类型,准确率达99.88%,但人工手动提取流量特征耗费人力物力,成本较高,不适用于大规模IIoT数据处理;文献[10]将流量截取2 500 byte长度,采用CNN+双向LSTM提取设备时间与空间特征,识别准确率达99.91%,但流量截取字节长度过长,且模型复杂度过高,难以部署;文献[11]仅将流量数据切分至应用层,忽略了数据包OSI模型其他层特征信息,识别结果不够精确,且模型参数量较多;文献[34]采用128个5×5与64个3×3大小的卷积核提取流量特征,虽达到最高识别精度,但模型参数量最大;本文所提MDCM模型准确率、精确率、召回率与F1−score指标均达到最优,且参数量最小。
作者简介
郝秦霞(1980—),女,陕西西安人,副教授,博士,主要研究方向为物联网应用、矿山安全,E-mail:haoqinxia@xust.edu.cn。
引用格式
郝秦霞,李慧敏. 煤矿工业物联网设备识别模型[J]. 工矿自动化,2024,50(3):99-107.
HAO Qinxia, LI Huimin. Recognition model of IIoT equipment in coal mine[J]. Journal of Mine Automation,2024,50(3):99-107.
扫码阅读全文