基于文本超图构建的中文仇恨言论检测模型

作者

张顺香王琰慧李冠憬周渝皓李嘉伟
单位

安徽理工大学计算机科学与工程学院合肥综合性国家科学中心人工智能研究院安徽理工大学数学与大数据学院
摘要

目的仇恨言论检测可以判定文本是否具有仇恨倾向，有助于筛除网络上的不当言论，维护网络环境的安全与秩序。为有效解决现有的仇恨言论检测方法依赖单一特征的图结构，难以捕捉文中由于对目标对象的隐性提及以及修辞手法的使用所带来的复杂语义，从而导致仇恨言论检测准确率不高的问题。方法提出一种基于文本超图构建的中文仇恨言论检测模型，通过分析文本中的语序和语法信息，及利用大语言模型针对目标对象所获取的语义扩展信息来构建文本超图，从而提升仇恨言论检测的效果。首先，构建提示模板引导大语言模型识别文本中的目标对象，并对其进行知识补充作为文本的语义扩展信息；然后，构建文本超图，以挖掘文本中隐含的语义结构和关联关系，并通过超图注意力机制聚合超图信息得到全局特征；同时，利用roberta-wwm-ext对原始文本进行动态特征提取，得到文本特征；最后利用交叉注意力机制实现文本特征与全局特征的融合，并通过sigmoid计算仇恨倾向检测仇恨言论。结果在COLDataset数据集上进行实验，该方法在实验中取得了较好的效果，可以提高检测的精确率和F1值。结论实验结果表明，该模型能够有效地提升中文仇恨言论的检测效果。
关键词

仇恨言论检测文本超图大语言模型roberta-wwm-ext
基金项目(Foundation)

国家自然科学基金面上项目(62076006)；安徽高校协同创新基金资助项目(GXXT-2021-008)；
文章目录

1 相关工作
1.1 仇恨言论检测
1.2 大语言模型
2 文本超图中文仇恨言论检测模型
2.1 基于大型语言模型的仇恨文本数据标注方法
2.2 词嵌入层
2.3 文本超图构建
1)文本超图定义
2)语序超边
3)语法超边
4)语义扩展信息
2.4 超图注意力网络
1)点级注意力机制
2)边级注意力机制
2.5 交叉注意力机制
2.6 分类层
3 实验
3.1 实验数据集
3.2 评价指标
3.3 注释系统选择实验
3.4 实验设置
3.5 对比实验
①BERT[38]:
②HateBERT[39]:
③COLDetector[37]11 582:
④BiCHAT[13]4336:
⑤SexWEs[40]:
⑥BiGRU Glove FT[41]:
⑦GPT-3.5[42]:
⑧Chat-GLM4[43]:
⑨THG-CHD:
3.6 消融实验
①w/o LLM:
②w/o roberta-wwm-ext:
③w/o HyperGAT:
④w/o sequential:
⑤w/o syntactic:
⑥THG-CHD:
4 总结与展望
引用格式

[1]张顺香,王琰慧,李冠憬,等.基于文本超图构建的中文仇恨言论检测模型[J].安徽理工大学学报(自然科学版),2024,44(04):77-88.