• 论文
主办单位:煤炭科学研究总院有限公司、中国煤炭学会学术期刊工作委员会

于深度学习的天然气居民客户用气量异常检测

2024-09-03



创新点



     本文针对天然气居民客户用气量异常检测提出了 LSTM—LOWESS模型。首先从全局方面用长短期记忆神经网络(LSTM)检测出用气量时间序列数据中的异常序列,再从局部用LOWESS检测异常序列中的异常值和出现的时间点。借助深度学习技术挖掘天然气居民客户用气量数据中的异常,可以为天然气企业稽查异常情况提供参考,帮助企业防范不必要的经济损失,并且有效保障客户的安全,提升了天然气企业的智能化水平,体现了智慧燃气的理念。



长按二维码下载全文


基于深度学习的天然气居民客户用气量异常检测


作者:宫雨,李倩,曹馨

单位:中国石油大学(北京) 经济管理学院



摘要与关键词

     摘要:近年来,依托信息技术、人工智能等新兴技术,智慧燃气成为天然气行业的重要发展方向,促进了天然气行业快速发展和转型升级,也是新质生产力的体现。智能燃气表是智慧燃气的重要一环,其直接面向终端居民客户,通过监测其数据可以提高天然气行业的安全水平及经营管理效率,增强居民客户的满意度。针对天然气居民客户的用气量异常检测问题,提出将深度学习中的长短期记忆神经网络算法(LSTM)和传统的局部加权回归平滑法(LOWESS)相结合的异常检测模型,克服了传统异常检测模型建模时效率低下、无法给出异常值出现的具体时间等缺点。使用某天然气公司的生产数据验证了模型的实际效果,结果表明,异常检测模型效率更高,能有效地检测出用气量异常及异常值出现的时间点,为用气量异常检测提供了新的解决方案,有利于推动天然气行业新质生产力发展。

     关键词:用气量异常检测;深度学习;智慧燃气;天然气居民客户;模型效果  


检测模型与效果验证

     1 居民用气量异常检测模型

     居民用气量异常检测模型由长短期记忆神经网络LSTM和局部加权回归平滑法LOWESS结合构建而成。本部分针对智能燃气表采集的、可以反映天然气居民客户每日用气量的时间序列数据,阐述了本文的异常检测任务面临的挑战及相应的解决思路,采用LSTM算法和局部加权回归平滑法LOWESS从全局和局部 2个方面构建两阶段的LSTM—LOWESS异常检测模型,先从全局检测出包含异常值的时间序列,再从局部检测出异常时间序列中的异常值。

      为了弥补循环神经网络(RNN)带来的梯度爆炸和梯度衰减的缺陷,两位学者共同提出了长短期记忆神经网络(LSTM),此为一种深度循环神经网络模型,通过在标准循环神经元内引入 “门” 的机制来提高记忆能力,同时解决了时间序列的长期依赖的问题。

     局部加权回归平滑法(LOWESS)可以找到时间序列数据随着时间变化的集中趋势和发展趋势,对数据执行平滑化,然后根据经验或者历史信息设置函数的平滑间隔参数,生成一个数据分布范围。根据所生成的分布范围,就可以进行异常检测,在分布范围内的时间点是正常数据,而在分布范围外的时间点,即大于范围的最大值和小于范围的最小值的就是异常点。 

      本文采用长短期记忆神经网络LSTM对天然气居民客户用气量数据进行预测,计算预测数据与原始数据的误差,误差越高,越有可能是异常的居民客户。之后,采用时间序列平滑法中的局部加权回归平滑法(LOWESS)对每个异常的居民客户进行每日用气量的检测,从而确定异常值及其出现的时间点或者时间段。LSTM—LOWESS模型依次挖掘和学习数据中蕴含的用气规律,使预测数据和原始数据的误差最小化,最终以预测误差作为每个居民客户的异常得分并按照误差大小对天然气居民客户排序。通过设置异常居民客户在所有居民客户所占的比例得到阈值,将异常得分高于阈值的判定为异常客户,低于阈值的则为正常客户。最后,LSTM—LOWESS模型以第一步检测出来的包含异常值的居民客户用气量数据作为输入,用LOWESS方法检测出与邻近用气数据差异较大的时间区间,即异常值出现的具体时间点或时间段,从而完成本文的异常检测任务。



     2 模型效果验证
     从智能燃气表数据管理系统提取了部分数据,涉及7个小区,分别命名为华北小区1和2,东北小区1和2,华东小区1,2和3。 
     LSTM—LOWESS模型使用平均绝对误差(MAE)作为误差衡量指标。MAE是预测值和真实值之差的绝对值的期望值。
     将华北小区1的256个居民客户的误差可视化后如图6所示。根据图6,将异常居民客户的比例设定为6%,得到16个包含异常数据的居民客户,并将华北小区的阈值(MAE)设定为0.17。
     使用局部加权回归平滑法(LOWESS)检测异常数据的具体位置,得到的结果如图7所示,在灰色区域外的点表示居民客户用气量数据中的异常数据点。通过图7,异常值表现出与全局数据或者局部数据之间波动较大的现象。
     表4展示LSTM—LOWESS模型对7个小区的居民客户分别设置异常阈值,其中所设定的居民客户占每个小区总居民客户数量的比例均为6%,7个小区的阈值平均数为0.15,意味着预测误差高于0.15的居民用户被判定为异常居民客户,反之则为正常居民客户。







结论

智慧燃气是发展天然气行业新质生产力的一项重要内容,促进了天然气业务与数字技术的融合创新、业务模式的重塑以及行业的转型发展。本文基于智能燃气表的数据解决天然气居民客户用气量异常检测的问题,提出LSTM—LOWESS模型,不仅检测出包含异常用气量数据的居民客户,而且可以检测异常居民客户用气量数据中的异常值出现的时间点或时间段,使用实际生产数据验证的结果表明模型可以高效、快速地检测天然气居民客户用气量异常。所提出的方法和模型为天然气行业的居民客户用气量异常检测提供了新思路,通过对居民客户用气量数据的异常检测,实现动态数据感知,充分挖掘数据的价值,以数据赋能业务、支撑业务决策,提升了天然气企业的数据管理水平和工作效率,有助于保障天然气安全、提高用户满意度,符合智慧燃气的发展方向,也是天然气行业的新质生产力发展的具体体现。







部分图表



图1 LSTM的细胞单元




图2 天然气居民客户用气量异常检测流程


图3 异常检测模型思路


图4 LSTM—LOWESS模型设计思路


图5 时间步长示意


图6 天然气居民客户的用气量预测误差


图7 16个用气量异常的居民客户


表1 预处理后的数据样例



表2 LSTM的结构


表3 LSTM—LOWESS模型伪代码


表4 LSTM—LOWESS模型阈值(MAE)




作者简介



     宫雨 ,男,山东蓬莱人,副教授,硕士生导师,主要研究方向为数据挖掘、能源数据分析、企业信息化。



作者简介






曹馨


《煤炭经济研究》青年编委



     曹馨,副教授、博士生导师,中国人民大学公共事业管理学士学位(2012),清华大学环境科学与工程博士学位(2018),中国石油大学(北京)青年拔尖人才、青年人才培育计划。长期从事行业节能减排、能源-经济-环境系统分析、复杂系统优化等领域研究。主持国家重点研发计划项目、国家自然科学基金面上项目、国家自然科学基金青年科学基金、教育部人文社会科学研究项目、国家重点实验室开放课题等多项国家级、省部级课题,在Applied energy、《管理科学学报》等国内外重要期刊发表论文20余篇,主编或参编《第四次气候变化国家评估报告》、《工业节能减排管理:潜力评估模型、技术路径分析及绿色工厂设计》等论著6部,获软件著作权2项,兼任中国系统工程学会能源资源系统工程专委会委员、中国高等教育学会碳中和与清洁能源教育专业委员会委员、光明日报IWAES智库委员,Environmental Science & Technology, Applied Energy等重要期刊审稿人,获中国管理科学学会管理科学奖等荣誉称号。




引用来源



宫雨,李倩,曹馨. 基于深度学习的天然气居民客户用气量异常检测[J]. 煤炭经济研究,2024,44(7):27-34.


  责任编辑:宫在芹

主办单位:煤炭科学研究总院有限公司 中国煤炭学会学术期刊工作委员会

©版权所有2015 煤炭科学研究总院有限公司 地址:北京市朝阳区和平里青年沟东路煤炭大厦 邮编:100013
京ICP备05086979号-16  技术支持:云智互联