• 论文
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
基于YOLOv8的煤矿井下人员不安全动作检测算法
  • 151
  • 作者

    陈伟江志成田子建张帆刘毅

  • 单位

    中国矿业大学(北京)人工智能学院煤矿智能化与机器人创新应用应急管理部重点实中国矿业大学计算机科学与技术学院

  • 摘要
    煤矿井下复杂环境中存在干扰信息、低照明度以及机械设备遮挡等问题,使得现有的目标检测算法在进行人员异常动作检测任务时,算法的速度和精度都存在一系列挑战。为解决现有的目标检测模型计算复杂、参数量大、推理时间长以及特征提取困难等问题,提出了一种改进的YOLOv8l方法,称为MAC-YOLO。MAC-YOLO模型通过替换原有基线模型中的卷积为感受野注意卷积(RFAConv),允许模型可以根据输入数据复杂性和重要性动态调整感受野权重,解决标准卷积运算中的参数共享问题,使得网络可以更有效地捕捉和利用图像中的信息。同时在基线模型中引入了高效多尺度注意力(EMA)模块,能够融合不同尺度的上下文信息,且在卷积运算时不进行通道降维的情况下学习到有效的通道描述,使模型能够对高级特征图产生更好的像素级关注。它也能捕获跨维度交互并建立维度之间的依赖关系,使得神经元巨大的局部感受野能高效获得更清晰的多尺度特征,降低了图像中干扰因素的影响,进一步提升了模型对目标特征的聚焦能力,有助于模型高效地进行卷积操作提取煤矿井下人员的异常动作,提高模型的检测精度。此外,引入边界框回归的损失函数(LMPDIoU),直接最小化预测框和真实框左上点和右下点之间的距离,解决了原有损失函数存在预测框和真实框长宽比相同(值不同)时模型无法有效优化的问题,加快了模型的收敛速度同时提升定位精度。在降低模型计算复杂性、网络结构复杂性以及增强网络灵活性方面,使用了slim-neck设计范式对基线模型的颈部进行改造,通过GSbottleneck模块增强网络处理特征的能力,利用GSConv模块堆叠提高模型的学习能力,其中的VoV-GSCSP模块提高了特征利用效率和网络性能。实验结果显示,在特定场景的煤矿工人动作数据集(MACD)上,相比基线模型YOLOv8l,MAC-YOLO的mAP@0.5和mAP@0.5:0.95分别提升了1.9%和3.6%,且FPS值为81ms。这表明MAC-YOLO模型在保持良好检测精度的同时,也满足了实时性和轻量化模型的需求,展示了高灵活性、准确性和效率。此外,还通过消融实验证明了各个改进模块对提升模型性能的有效性。
  • 关键词

    人员异常动作检测YOLOv8l模型轻量化EMAMPDIoU损失

  • 文章目录
    0 引言
    1 YOLOv8模型
    1.1C3模块和C2f模块
    1.2骨干网络和Neck
    1.3SPPF模块
    1.4特征提取
    1.5损失函数
    1.5.1正负样本分配策略
    1.5.2 Loss 计算
    2基于YOLOv8l改进的MAC-YOLO模型
    2.1用感受野卷积替换标准卷积
    2.1.1空间注意力
    2.1.2感受野注意力卷积
    2.2添加EMA注意力机制
    2.3 slim-neck轻量化模块
    2.4优化边界框损失函数
    3实验结果及分析
    3.1实验准备
    3.1.1实验环境
    3.1.2实验数据集
    3.1.3评价指标
    3.1.4实验结果与分析
    3.2消融实验
    3.3对比试验
    4结论
相关问题

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联