• 全部
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会
基于大语言模型的矿山事故知识图谱构建
  • 9
  • 作者

    张朋杨 生龙 王巍 魏忠诚

  • 单位

    河北工程大学信息与电气工程学院河北工程大学河北省安防信息感知与处理重点实验室

  • 摘要
    现有矿山领域知识图谱构建方法在预训练阶段需要大量人工标注的高质量监督数据,人力成本高且效率低。大语言模型(LLM)可在少量人工标注的高质量数据下显著提高信息抽取的质量且效率较高,然而LLM结合Prompt的方法会产生灾难性遗忘问题。针对上述问题,将图结构信息嵌入到Prompt模板中,提出了图结构Prompt,通过在LLM上嵌入图结构Prompt,实现基于LLM的矿山事故知识图谱高质量构建。首先,收集煤矿安全生产网公开的矿山事故报告并进行格式修正、冗余信息剔除等预处理。其次,利用LLM挖掘矿山事故报告文本中蕴含的知识,对矿山事故报告文本中的实体及实体间关系进行K-means聚类,完成矿山事故本体构建。然后,依据构建的本体进行少量数据标注,标注数据用于LLM的学习与微调。最后,采用嵌入图结构Prompt的LLM进行信息抽取,实例化实体关系三元组,从而构建矿山事故知识图谱。实验结果表明:在实体抽取和关系抽取任务中,LLM的表现优于通用信息抽取(UIE)模型,且嵌入图结构Prompt的LLM在精确率、召回率、F1值方面均高于未嵌入图结构Prompt的LLM。
  • 关键词

    矿山事故知识图谱大语言模型图结构Prompt本体构建信息抽取

  • 文章目录


    0 引言
    1 基于LLM的矿山事故知识图谱构建
    1.1 模式层构建
    1.2 数据层构建
    2 实验验证
    2.1 数据集构建
    2.2 信息抽取结果
    2.3 知识图谱构建结果
    3 结论
  • 引用格式
    张朋杨,生龙,王巍,等.基于大语言模型的矿山事故知识图谱构建[J/OL].工矿自动化,1-8[2025-03-08].https://doi.org/10.13272/j.issn.1671-251x.2024080031.
相关问题
立即提问

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联