一
研究背景
工作人员的不安全行为导致的安全生产事故在中国煤矿井下安全生产事故中占比高达97.67%。研究井下工作人员的不安全行为对降低事故发生率、实现煤矿井下安全生产具有重要意义。本文提出了一种基于煤矿井下不安全行为知识图谱构建方法。
二
研究内容
1) 针对井下不安全行为实体识别中实体数量庞大、交替频繁、语义复杂等问题,采用改进神经网络模型实现井下不安全行为实体识别。在BiLSTM−CRF基础上引入RoBERTa及多层感知机(MLP)作为井下不安全行为命名实体识别模型(RoBERTa− BiLSTM− MLP− CRF)。结合现有的知识,用传统机器学习和深度学习算法相结合的方法进行命名实体识别,采用RoBERTa进行词语向量化后,通过双向长短时记忆网络(BiLSTM)对向量进行标注,提高网络模型对上下文特征的捕捉能力,通过MLP解决煤矿井下不安全行为数据集数据量不足的问题,采用条件随机场(CRF)模型解决单词关系不识别问题,并捕获全文信息和预测结果。
2) 根据语句的结构特点,将句子的依存关系转换为语法树,分析比对三元组知识的枝条结构,利用树的遍历搜索整个句子的语法树结构;并将每个并列句视为单独存在的句子,分步对其进行三元组抽取,更深度地抽取语句知识。
3) 利用图数据库 Neo4j 存储煤矿井下不安全行为知识,形成井下不安全行为知识图谱。
三
实验及结果分析
1) RoBERTa− BiLSTM− MLP− CRF模型对于导致后果、违反性行为、错误性行为及粗心性行为4类实体具有较好的识别效果,识别准确率分别为86.7%,80.3%,80.7%,77.4%,对于遗忘性行为及关联因素影响性行为识别效果较差,识别准确率分别为63.5%,73.0%。
2)RoBERTa− BiLSTM− MLP− CRF模型的准确率、召回率、F1 较 RoBERTa− BiLSTM− CRF模型分别提高了1.6%,1.5%,1.6%,这表明添加 MLP后能够学习更多公共数据集的特征,用此模型对公共数据集进行训练,对实验有正确的导向作用。
作者简介
付燕(1972—) ,女,河南鹤壁人,教授,博士,主要研究方向为计算机图形图像处理技术、科学计算及其可视化技术等,E-mail:942542352@qq.com。
引用格式
付燕,刘致豪,叶鸥. 基于煤矿井下不安全行为知识图谱构建方法[J]. 工矿自动化,2024,50(1):88-95.
FU Yan, LIU Zhihao, YE Ou. A method for constructing a knowledge graph of unsafe behaviors in coal mines[J]. Journal of Mine Automation,2024,50(1):88-95.
扫码阅读全文