-
作者
刘军王慧民张兴忠张婷郭美青
-
单位
太原理工大学软件学院
-
摘要
针对路面裂缝检测场景中裂缝形状不规则和背景复杂引起的检测精度较低的问题,提出了一种基于transformer的端到端路面裂缝检测方法CrackFormerNet.首先,在特征提取阶段,引入多尺度特征融合机制,设计了Multi-Scale Transformer骨干网络,将不同下采样倍率特征图融合,提取细节信息丰富的裂缝纹理特征。其次,提出基于CIoU Loss和L1 Loss的联合回归损失函数来度量预测框和标签间距离,精确评估预测框检测效果。同时,为应对transformer模型收敛缓慢的问题,在编码器-解码器阶段使用Pre-LN Transformer结构,在残差连接内部使用层归一化,加速模型收敛。实验结果表明,方法MAP达到84.2%,优于主流基准方法。与DETR检测方法相比,模型收敛轮次压缩18.4%,检测精度提升3.6%,证明了该方法的有效性。
-
关键词
路面裂缝检测多尺度特征融合Pre-LNTransformer网络联合回归损失端到端
-
基金项目(Foundation)
山西省重点研发计划项目(201803D31041);国网山西省电力公司信息化项目(B1051C200016);
-
文章目录
1 路面裂缝检测模型
1.1 CrackFormerNet模型架构
1.2 Multi-Scale Transformer骨干网络
1.3 Pre-LN Transformer编码器-解码器
1.4 联合回归损失设计
2 路面裂缝数据集
2.1 数据集构建
2.2 数据集分析
3 实验结果与分析
3.1 实验环境
3.2 模型训练
3.3 评价指标
1) 平均均值精度(mean average precision, MAP)
2) 每秒帧率(frames per second, FPS)
3.4 实验结果与分析
3.4.1 检测精度和速度对比
3.4.2 模型收敛性对比
3.4.3 消融实验
4 结论
-
引用格式
刘军,王慧民,张兴忠,张婷,郭美青.基于Transformer的端到端路面裂缝检测方法[J].太原理工大学学报,2022,53(06):1143-1151.DOI:10.16355/j.cnki.issn1007-9432tyut.2022.06.021.