点击蓝字 关注我们

创新点
本文以中央与地方政府公开发布的“双碳”政策文本为数据源,提出了“双碳”政策本体模型,采用Text Rank、LDA、Word2vec等多种方法抽取了“双碳”政策实体、属性和政策关系,使用Neo4j图数据库构建了“双碳”政策知识图谱,并通过Cypher语言实现了从多个维度将查询结果以图网络的形式呈现。


长按二维码下载全文
基于自然语言处理的“双碳”政策知识图谱构建及应用
作者:吕涛,王青山,张紫玉,吴昱磊,周孜柔,王洛
单位:中国矿业大学 经济管理学院
摘要与关键词
摘要:“双碳”政策具有发布数量多、覆盖范围广、内容复杂多样等特点,现有的呈现方式难以满足知识检索和内在分析的需求。以2953条“双碳”政策文本为数据源,提出了一种基于自然语言处理的“双碳”政策知识图谱构建方法,首先构建了知识图谱模式层,定义了“双碳”政策实体、属性和关系,之后采用Text Rank关键词抽取、LDA主题建模等算法提取政策实体、属性及关系,构建了知识图谱数据层,最终将〈实体, 关系, 实体〉三元组存入Neo4j图数据库,形成“双碳”政策知识图谱。所构建的知识图谱包含2048个实体节点和32336条关系,可通过Cypher语言实现不同细粒度政策实体和关系的关联查询与可视化,挖掘“双碳”政策中的关键语义信息和政策热点,还可为智能服务提供语义增强功能,提高“双碳”政策推荐系统的效率和政策问答系统的准确度。
关键词:“双碳”政策;知识图谱;自然语言处理;Neo4j;LDA;Text Rank
结论
本文基于2953条双碳政策文本,采用自顶向下的知识图谱构建方法,在模式层构建了双碳政策本体模型;在数据层使用多种抽取方式,充分抽取了双碳政策的属性和关联关系,并将政策主题、政策引用关系、政策相似度等多种关系通过neo4j以图网络的方式进行了呈现。本文的创新和贡献主要体现在以下3个方面。
1)不同于以往以学术文献为数据源的双碳政策研究方式,本文聚焦于双碳政策本身,直接从政策文本中挖掘关键信息构建知识图谱,增强了知识图谱的实践应用价值。
2)采用自顶向下的知识图谱构建策略, 深入挖掘双碳政策文本特性与要素,构建了层次清晰、冗余度低的双碳政策本体模型,为信息抽取和图谱构建提供支持。
3)依托所构建的双碳政策知识图谱, 结合Neo4j图数据库的查询语言,实现了多维度政策信息的图形化查询与展示,提高了政策检索和查询的效率。
基于自然语言处理的双碳政策知识图谱具有广泛的应用价值。首先,通过知识图谱可以分析双碳政策的时空演化,探讨双碳政策在政策目标、政策主题、政策制定者等方面的发展演化过程,同时分析不同区域政策的异质性和适应性。其次,双碳政策知识图谱有利于综合从省市级到国家级的非同源信息,方便决策者通过知识图谱的多层次分析框架解构政策信息,挖掘政策内容的内在联系和政策间的关联关系,从而提供更为全面和立体的政策理解,为决策者把握和响应双碳政策提供科学依据。最后,双碳政策知识图谱可以为政策推荐系统、问答系统等智能服务提供语义增强功能,充分利用政策间的语义关联理解用户需求,提供更高效的政策推荐和精准的政策解答。
本文的研究仍存在改进之处。一是加强数据获取。双碳政策文本分散于多个渠道,未来研究需探索更广泛的数据收集策略,以确保数据源全面可靠。二是完善政策本体内容。现有政策本体模型在模式层的实体覆盖上尚显不足,后续研究可以从政策直接支持的行业、政策间接影响的行业等多个维度扩展本体模型,从而更全面地对双碳政策进行知识表示。三是提升抽取算法。引入能挖掘上下文语义信息的神经网络算法如BERT、GPT、LSTM 等算法,实现更准确地抽取政策文本中的语义信息。这些改进方向将成为后续研究的重点攻关领域。
部分图表

图1 “双碳”政策知识图谱构建过程

图2 “双碳”政策知识图谱本体模型

图3 “双碳”政策文本主题建模过程

图4 政策-主题分布

图5 江苏省“工业信息化”相关政策知识图谱

图6 《碳排放权交易管理暂行条例》的关联节点
表1 “双碳”政策知识图谱中的实体定义

表2 “双碳”政策知识图谱中的属性定义

表3 “双碳”政策知识图谱中的关系定义

表4 “双碳”政策主题建模分布

表5 政策-主题关系示例

表6 政策关键词抽取示例

表7 政策相似度示例

表8 图5中政策编号对应的政策标题

表9 政策属性及属性值示例

表10 图6中政策编号对应的政策标题

表11 政策被引Top10

参考文献
(上下滑动阅读更多内容)



作者简介

吕涛
《煤炭经济研究》编委
吕涛,管理学博士,环境科学与工程博士后,中国矿业大学经济管理学院教授,博士生导师。“碳中和与能源战略”智库负责人、首席专家,校学术委员会委员,管理科学与工程一级学科负责人、学科建设与指导委员会主任,江苏省“333”高层次人才培养工程中青年科学技术带头人。
主要从事能源系统转型、能源应急管理等领域的研究工作。担任中国管理科学与工程学会理事,中国系统工程学会能源资源系统工程分会常务理事,中国“双法”研究会能源经济与管理研究分会理事,中国煤炭经济研究智库专家,中国煤 炭经济研究会常务理事。
主持承担及完成国家自然科学基金、国家社科基金等国家级项目4项,国家自然科学基金、国家社科基金项目通讯评审专家,在Energy Economics、Energy Policy、IEEE Transactions on Power Systems、中国管理科学等期刊发表论文100余篇,7篇论文被人大复印资料全文转载,70余篇论文被SCI(SSCI)、CSSCI收录。研究成果获省部级二等奖1项、三等奖3项。
引用来源
吕涛,王青山,张紫玉,等.基于自然语言处理的“双碳”政策知识图谱构建及应用[J].煤炭经济研究,2025,45(2):122-132.

往期浏览

2025年第1期
2024年第1期
2024年第3期
2024年第7期
2024年第2期
2024年第4期
2024年第8期
整理:罗棋鸿(实习)
编辑:薛国春
审核:柳 妮
电话:010-84261852
邮箱:mtjjyj2015@126.com
网站:www.mtjjyj.com
声明:《煤炭经济研究》已刊发此文,享有本论文的数字化复制权、发行权、汇编权及信息网络传播权。转载或者引用本文内容请注明来源,对于不遵守此声明或者其他违法使用本文内容者,《煤炭经济研究》依法保留追究权。
扫码关注 | 煤炭经济研究