• 全部
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会

《煤炭经济研究》2025年第2期 | 吕涛编委:基于自然语言处理的“双碳”政策知识图谱构建及应用

2025-03-28

点击蓝字 关注我们




创新点



     本文以中央与地方政府公开发布的“双碳”政策文本为数据源,提出了“双碳”政策本体模型,采用Text Rank、LDA、Word2vec等多种方法抽取了“双碳”政策实体、属性和政策关系,使用Neo4j图数据库构建了“双碳”政策知识图谱,并通过Cypher语言实现了从多个维度将查询结果以图网络的形式呈现。



长按二维码下载全文


基于自然语言处理的“双碳”政策知识图谱构建及应用


作者:吕涛,王青山,张紫玉,吴昱磊,周孜柔,王洛

单位:中国矿业大学 经济管理学院



摘要与关键词

     摘要:“双碳”政策具有发布数量多、覆盖范围广、内容复杂多样等特点,现有的呈现方式难以满足知识检索和内在分析的需求。以2953条“双碳”政策文本为数据源,提出了一种基于自然语言处理的“双碳”政策知识图谱构建方法,首先构建了知识图谱模式层,定义了“双碳”政策实体、属性和关系,之后采用Text Rank关键词抽取、LDA主题建模等算法提取政策实体、属性及关系,构建了知识图谱数据层,最终将〈实体, 关系, 实体〉三元组存入Neo4j图数据库,形成“双碳”政策知识图谱。所构建的知识图谱包含2048个实体节点和32336条关系,可通过Cypher语言实现不同细粒度政策实体和关系的关联查询与可视化,挖掘“双碳”政策中的关键语义信息和政策热点,还可为智能服务提供语义增强功能,提高“双碳”政策推荐系统的效率和政策问答系统的准确度。

     关键词:“双碳”政策;知识图谱;自然语言处理;Neo4j;LDA;Text Rank


结论

     本文基于2953条双碳政策文本,采用自顶向下的知识图谱构建方法,在模式层构建了双碳政策本体模型;在数据层使用多种抽取方式,充分抽取了双碳政策的属性和关联关系,并将政策主题、政策引用关系、政策相似度等多种关系通过neo4j以图网络的方式进行了呈现。本文的创新和贡献主要体现在以下3个方面。

     1)不同于以往以学术文献为数据源的双碳政策研究方式,本文聚焦于双碳政策本身,直接从政策文本中挖掘关键信息构建知识图谱,增强了知识图谱的实践应用价值。

     2)采用自顶向下的知识图谱构建策略, 深入挖掘双碳政策文本特性与要素,构建了层次清晰、冗余度低的双碳政策本体模型,为信息抽取和图谱构建提供支持。

     3)依托所构建的双碳政策知识图谱, 结合Neo4j图数据库的查询语言,实现了多维度政策信息的图形化查询与展示,提高了政策检索和查询的效率。

     基于自然语言处理的双碳政策知识图谱具有广泛的应用价值。首先,通过知识图谱可以分析双碳政策的时空演化,探讨双碳政策在政策目标、政策主题、政策制定者等方面的发展演化过程,同时分析不同区域政策的异质性和适应性。其次,双碳政策知识图谱有利于综合从省市级到国家级的非同源信息,方便决策者通过知识图谱的多层次分析框架解构政策信息,挖掘政策内容的内在联系和政策间的关联关系,从而提供更为全面和立体的政策理解,为决策者把握和响应双碳政策提供科学依据。最后,双碳政策知识图谱可以为政策推荐系统、问答系统等智能服务提供语义增强功能,充分利用政策间的语义关联理解用户需求,提供更高效的政策推荐和精准的政策解答。

     本文的研究仍存在改进之处。一是加强数据获取。双碳政策文本分散于多个渠道,未来研究需探索更广泛的数据收集策略,以确保数据源全面可靠。二是完善政策本体内容。现有政策本体模型在模式层的实体覆盖上尚显不足,后续研究可以从政策直接支持的行业、政策间接影响的行业等多个维度扩展本体模型,从而更全面地对双碳政策进行知识表示。三是提升抽取算法。引入能挖掘上下文语义信息的神经网络算法如BERT、GPT、LSTM 等算法,实现更准确地抽取政策文本中的语义信息。这些改进方向将成为后续研究的重点攻关领域。


部分图表

图1 “双碳”政策知识图谱构建过程


图2 “双碳”政策知识图谱本体模型


图3 “双碳”政策文本主题建模过程

图4 政策-主题分布


图5 江苏省“工业信息化”相关政策知识图谱


图6 《碳排放权交易管理暂行条例》的关联节点


表1 “双碳”政策知识图谱中的实体定义


表2 “双碳”政策知识图谱中的属性定义


表3 “双碳”政策知识图谱中的关系定义


表4 “双碳”政策主题建模分布


表5 政策-主题关系示例


表6 政策关键词抽取示例


表7 政策相似度示例


表8 图5中政策编号对应的政策标题


表9 政策属性及属性值示例


表10 图6中政策编号对应的政策标题


表11 政策被引Top10


参考文献

(上下滑动阅读更多内容)



作者简介





吕涛



《煤炭经济研究》编委



     吕涛,管理学博士,环境科学与工程博士后,中国矿业大学经济管理学院教授,博士生导师。“碳中和与能源战略”智库负责人、首席专家,校学术委员会委员,管理科学与工程一级学科负责人、学科建设与指导委员会主任,江苏省“333”高层次人才培养工程中青年科学技术带头人。

     主要从事能源系统转型、能源应急管理等领域的研究工作。担任中国管理科学与工程学会理事,中国系统工程学会能源资源系统工程分会常务理事,中国“双法”研究会能源经济与管理研究分会理事,中国煤炭经济研究智库专家,中国煤 炭经济研究会常务理事。

     主持承担及完成国家自然科学基金、国家社科基金等国家级项目4项,国家自然科学基金、国家社科基金项目通讯评审专家,在Energy Economics、Energy Policy、IEEE Transactions on Power Systems、中国管理科学等期刊发表论文100余篇,7篇论文被人大复印资料全文转载,70余篇论文被SCI(SSCI)、CSSCI收录。研究成果获省部级二等奖1项、三等奖3项。



引用来源



     吕涛,王青山,张紫玉,等.基于自然语言处理的“双碳”政策知识图谱构建及应用[J].煤炭经济研究,2025,45(2):122-132.


往期浏览

2025年第1期

2024年第1期

2024年第3期

2024年第7期

2024年第2期

2024年第4期

2024年第8期


整理:罗棋鸿(实习)

编辑:薛国春

审核:柳   妮

电话:010-84261852

邮箱:mtjjyj2015@126.com

网站:www.mtjjyj.com

声明:《煤炭经济研究》已刊发此文,享有本论文的数字化复制权、发行权、汇编权及信息网络传播权。转载或者引用本文内容请注明来源,对于不遵守此声明或者其他违法使用本文内容者,《煤炭经济研究》依法保留追究权。




扫码关注 | 煤炭经济研究



今日专家
亮点论文

创新点本研究基于全生命周期视角 , 以锂、钴、镍、 铜、铂和稀土 6 类典型能源金属为例 , 刻画我国能源金属原材料阶段供需格局 , 系统厘清我国能源金属的对外依...

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联