• 论文
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
基于截断历史注意力的商品评论属性词抽取框架
  • 作者

    张顺香赵彤朱广丽张镇江孙争艳

  • 单位

    安徽理工大学计算机科学与工程学院

  • 摘要
    针对传统的属性词抽取模型难以有效抽取隐式属性词,导致属性词抽取不完整的问题,提出了一种基于截断历史注意力机制的商品评论属性词抽取框架THA-BiLSTM-CRF.首先,利用CBOW模型预处理文本,获得包含语义信息的词向量;然后,通过BiLSTM模型抽取文本特征;接着,引入截断历史注意力机制,建立包含属性词和单词间映射关系的词库,获取单词间的隐式关系;最后,通过CRF算法抽取隐式属性词。实验结果表明,该框架可以有效抽取隐式属性词,提高了属性词抽取的完整度。
  • 关键词

    商品评论属性词抽取截断历史注意力机制BiLSTM-CRF

  • 基金项目(Foundation)
    国家自然科学基金面上资助项目(62076006);安徽省自然科学基金面上资助项目(1908085MF189);安徽高校协同创新资助项目(GXXT-2021-008);安徽省重点研发计划国际科技合作专项资助(202004611020029);
  • 文章目录
    1 相关工作
    1.1 基于统计概率的方法
    1.2 基于深度学习的方法
    2 基于BiLSTM-CRF的显式属性词抽取
    2.1 文本预处理
    2.2 BiLSTM-CRF模型介绍
    2.2.1 BiLSTM层
    2.2.2 CRF层
    2.3 显式属性词抽取过程
    3 基于THA的隐式属性词抽取
    3.1 截断历史注意模块
    3.2 二次计算模块
    4 实验及结果分析
    4.1 实验数据集
    4.2 评价指标
    4.3 实验环境
    4.4 实验方法
    1) 实验数据获取。
    2) 实验数据预处理。
    3) 抽取显式属性词和其对应的观点词。
    4) 抽取隐式属性词。
    5) 设计本模型与其他模型的对比实验。
    4.5 实验结果
    4.5.1 隐式属性词抽取结果举例
    4.5.2 模型性能对比
    5 总结
  • 引用格式
    张顺香,赵彤,朱广丽,张镇江,孙争艳.基于截断历史注意力的商品评论属性词抽取框架[J].太原理工大学学报,2022,53(02):231-239.DOI:10.16355/j.cnki.issn1007-9432tyut.2022.02.006.
相关问题

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联