-
作者
谢新林尹东旭续欣莹刘晓芳罗臣彦谢刚
-
单位
太原科技大学电子信息工程学院先进控制与装备智能化山西省重点实验室太原理工大学电气与动力工程学院
-
摘要
依据图像级标签位置推断方式的不同,将基于图像级标签的弱监督图像语义分割划分为基于超像素的方法和基于分类网络先验的方法,并分别从各类方法的原理、优缺点、关键环节、主要技术、特征、超像素/候选区域分割方式、种子区域产生方式、网络结构和数据集等方面进行了详细的分析和总结。其次,对基于图像级标签的弱监督图像语义分割常用的数据集和评价指标进行了总结,并对各数据集的特点进行了详细的描述。最后,在MSRC、PASCAL VOC 2012、MS COCO和Sift Flow数据集上对基于图像级标签的弱监督图像语义分割方法的性能进行了对比与分析,并分别从面向大规模多媒体分享网站大数据、特定应用场景、图像级标签位置推断策略三个研究方向对弱监督图像语义分割的研究方向进行了展望和预测。
-
关键词
语义分割弱监督学习图像级标签超像素深度卷积神经网络
-
基金项目(Foundation)
国家自然科学基金资助项目(62006169);山西省自然科学基金资助项目(201901D211304、201904D131023);
-
文章目录
1 基于超像素的弱监督图像语义分割方法
1.1 以超像素为处理单元的方法
1.2 以候选区域为处理单元的方法
2 基于分类网络先验的弱监督图像语义分割方法
2.1 基于类激活图定位网络的方法
2.2 基于其它分类网络的方法
3 常用数据集与评价指标
3.1 常用数据集
3.1.1 MSRC(microsoft research cambridge)数据集
3.1.2 PASCAL VOC 2012数据集
3.1.3 MS COCO(microsoft common objects in context)数据集
3.1.4 Sift Flow数据集
3.1.5 Cityspaces数据集
3.2 评价指标
4 基于图像级标签的弱监督图像语义分割方法性能对比
4.1 MSRC数据集上的性能对比
4.2 PASCAL VOC 2012数据集上的性能对比
4.3 MS COCO数据集上的性能对比
4.4 Sift Flow数据集上的性能对比
5 总结与展望
1) 面向大规模多媒体分享网站大数据的弱监督图像语义分割。
2) 特定应用场景下的弱监督图像语义分割。
3) 高质量和稠密的图像级标签位置推断策略。
-
引用格式
谢新林,尹东旭,续欣莹,刘晓芳,罗臣彦,谢刚.基于图像级标签的弱监督图像语义分割综述[J].太原理工大学学报,2021,52(06):894-906.DOI:10.16355/j.cnki.issn1007-9432tyut.2021.06.007.