近日,研究中心负责人、中国矿业大学信息与控制工程学院党委书记程德强教授课题组在深度估计领域取得研究进展,研究成果形成论文“基于层级特征融合的室内自监督单目深度估计”,以中国矿业大学为第一单位、程德强教授为第一作者、钱建生教授为通信作者,被EI检索的《光学精密工程》正式录用。
论文介绍
该文章针对目前自监督单目深度估计网络在充斥着大量低纹理、低光照区域的室内复杂场景中存在预测深度信息不精确、物体边缘模糊以及细节丢失严重等问题,提出一种基于层级特征融合的室内自监督单目深度估计网络模型。该模型通过映射一致性图像增强模块处理室内图像,提升低光照区域可见性并且保持亮度一致性,丰富纹理细节,一定程度上解决了训练网络时出现模糊假平面恶化模型的问题。然后设计基于注意力机制的跨层级特征调整模块,在深度估计网络中充分融合编、解码器多层级特征信息,提升网络的特征利用能力,缩小预测深度与真实深度的语义差距。最后利用基于图像风格特征的格拉姆矩阵相似性损失函数作为额外的自监督信号进行模型约束,提升网络预测深度的能力,进一步提高了预测深度的精度。在NYU Depth V2 和 ScanNet 室内数据集上进行训练与测试,正确预测深度像素的比例能够分别达到81.9%和76.0%。实验结果表明,相比现有主要的室内自监督单目深度估计网络,该网络模型很好地保持了物体边缘和细节信息,有效地提高了预测深度的精度。深度估计广泛应用于无人驾驶、三维重建、增强现实、点云图像生成等场景中,在智能矿山建设中的矿卡无人驾驶、井下真三维场景平台的构建和增强现实等领域具有广阔的应用前景。
1.网络框架
2.客观指标对比
3.主观视觉对比
论文依托于国家自然科学基金项目“矿井复杂受限空间中低质图像增强方法研究”开展研究,该项目由中国矿业大学智能检测与模式识别研究中心核心成员承担。研究中心成立以来,发明了30多种面向矿井特殊作业环境的全矿井视频分析算法,研制了系列云-边-端协同分析的智能分析摄像仪,拥有多种针对煤矿场景下的图像处理相关的高质量论文、核心专利技术以及软件著作权等独立知识产权。
研究中心秉持专注人-机-环的作业安全和竭诚服务矿山本质安全的宗旨,主要面向有人员违章、环境参数异常、设备工作状态的监管需求的煤矿、非煤矿企业,提供安全生产场景的视频分析技术和边缘AI智能装备践行服务煤矿安全生产的使命担当!