• 论文
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
基于标签相关性学习网络的多标签图像分类方法
  • 111
  • 作者

    王路芳 张海云

  • 单位

    山西财经大学实验实训中心山西大学大数据科学与产业研究院山西大学计算机与信息技术学院

  • 摘要
    针对多标签图像分类任务中的标签特征混乱和标签关系局限性问题,本文提出了一种基于标签相关性学习网络的多标签图像分类方法(MLLCLN)。该方法了采用掩码注意力方法和多头自注意力机制。在掩码注意力方法中,通过图像真实标签对应的状态词向量遮盖注意力机制产生的标签特征,使模型能获得更多上下文信息,一定程度上避免了注意力机制的注意力区域重叠的问题。设计了标签相关性学习网络,该网络是由多层多头注意力机制和图神经网络组成。多头自注意力机制能够基于标签特征学习局部标签关系,而图神经网络使用了现有的方法ML-GCN作为引导,使模型能同时考虑全局标签关系,缓解了由于标签关系局限性导致的模型出现虚假预测的问题。MLLCLN在公开数据集MSCOCO2014和VOC2007上的实验结果表明了其较好的性能,分类精度分别达到了84.4%和96.0%,为多标签图像分类提供了新思路。
  • 关键词

    多头自注意力机制多标签图像分类注意力机制自适应权重卷积神经网络

  • 文章目录

    1 基于标签相关性的多标签图像分类方法
    1.1 掩码注意力网络
    1.2 标签相关性学习网络
    2 实 验
    2.1 实验设置
    2.2 对比实验结果
    2.3 消融实验
    2.3.1 掩码模块
    2.3.2标签相关性学习网络
    3 结 语
  • 引用格式
    王路芳,张海云.基于标签相关性学习网络的多标签图像分类方法[J/OL].太原理工大学学报,1-12[2024-08-16].http://kns.cnki.net/kcms/detail/14.1220.n.20240815.1354.002.html.
相关问题

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联