创新点
本文针对天然气居民客户用气量异常检测提出了 LSTM—LOWESS模型。首先从全局方面用长短期记忆神经网络(LSTM)检测出用气量时间序列数据中的异常序列,再从局部用LOWESS检测异常序列中的异常值和出现的时间点。借助深度学习技术挖掘天然气居民客户用气量数据中的异常,可以为天然气企业稽查异常情况提供参考,帮助企业防范不必要的经济损失,并且有效保障客户的安全,提升了天然气企业的智能化水平,体现了智慧燃气的理念。
长按二维码下载全文
基于深度学习的天然气居民客户用气量异常检测
作者:宫雨,李倩,曹馨
单位:中国石油大学(北京) 经济管理学院
摘要与关键词
摘要:近年来,依托信息技术、人工智能等新兴技术,智慧燃气成为天然气行业的重要发展方向,促进了天然气行业快速发展和转型升级,也是新质生产力的体现。智能燃气表是智慧燃气的重要一环,其直接面向终端居民客户,通过监测其数据可以提高天然气行业的安全水平及经营管理效率,增强居民客户的满意度。针对天然气居民客户的用气量异常检测问题,提出将深度学习中的长短期记忆神经网络算法(LSTM)和传统的局部加权回归平滑法(LOWESS)相结合的异常检测模型,克服了传统异常检测模型建模时效率低下、无法给出异常值出现的具体时间等缺点。使用某天然气公司的生产数据验证了模型的实际效果,结果表明,异常检测模型效率更高,能有效地检测出用气量异常及异常值出现的时间点,为用气量异常检测提供了新的解决方案,有利于推动天然气行业新质生产力发展。
关键词:用气量异常检测;深度学习;智慧燃气;天然气居民客户;模型效果
检测模型与效果验证
1 居民用气量异常检测模型
居民用气量异常检测模型由长短期记忆神经网络LSTM和局部加权回归平滑法LOWESS结合构建而成。本部分针对智能燃气表采集的、可以反映天然气居民客户每日用气量的时间序列数据,阐述了本文的异常检测任务面临的挑战及相应的解决思路,采用LSTM算法和局部加权回归平滑法LOWESS从全局和局部 2个方面构建两阶段的LSTM—LOWESS异常检测模型,先从全局检测出包含异常值的时间序列,再从局部检测出异常时间序列中的异常值。
为了弥补循环神经网络(RNN)带来的梯度爆炸和梯度衰减的缺陷,两位学者共同提出了长短期记忆神经网络(LSTM),此为一种深度循环神经网络模型,通过在标准循环神经元内引入 “门” 的机制来提高记忆能力,同时解决了时间序列的长期依赖的问题。
局部加权回归平滑法(LOWESS)可以找到时间序列数据随着时间变化的集中趋势和发展趋势,对数据执行平滑化,然后根据经验或者历史信息设置函数的平滑间隔参数,生成一个数据分布范围。根据所生成的分布范围,就可以进行异常检测,在分布范围内的时间点是正常数据,而在分布范围外的时间点,即大于范围的最大值和小于范围的最小值的就是异常点。
本文采用长短期记忆神经网络LSTM对天然气居民客户用气量数据进行预测,计算预测数据与原始数据的误差,误差越高,越有可能是异常的居民客户。之后,采用时间序列平滑法中的局部加权回归平滑法(LOWESS)对每个异常的居民客户进行每日用气量的检测,从而确定异常值及其出现的时间点或者时间段。LSTM—LOWESS模型依次挖掘和学习数据中蕴含的用气规律,使预测数据和原始数据的误差最小化,最终以预测误差作为每个居民客户的异常得分并按照误差大小对天然气居民客户排序。通过设置异常居民客户在所有居民客户所占的比例得到阈值,将异常得分高于阈值的判定为异常客户,低于阈值的则为正常客户。最后,LSTM—LOWESS模型以第一步检测出来的包含异常值的居民客户用气量数据作为输入,用LOWESS方法检测出与邻近用气数据差异较大的时间区间,即异常值出现的具体时间点或时间段,从而完成本文的异常检测任务。
结论
智慧燃气是发展天然气行业新质生产力的一项重要内容,促进了天然气业务与数字技术的融合创新、业务模式的重塑以及行业的转型发展。本文基于智能燃气表的数据解决天然气居民客户用气量异常检测的问题,提出LSTM—LOWESS模型,不仅检测出包含异常用气量数据的居民客户,而且可以检测异常居民客户用气量数据中的异常值出现的时间点或时间段,使用实际生产数据验证的结果表明模型可以高效、快速地检测天然气居民客户用气量异常。所提出的方法和模型为天然气行业的居民客户用气量异常检测提供了新思路,通过对居民客户用气量数据的异常检测,实现动态数据感知,充分挖掘数据的价值,以数据赋能业务、支撑业务决策,提升了天然气企业的数据管理水平和工作效率,有助于保障天然气安全、提高用户满意度,符合智慧燃气的发展方向,也是天然气行业的新质生产力发展的具体体现。
部分图表
图1 LSTM的细胞单元
图2 天然气居民客户用气量异常检测流程
图3 异常检测模型思路
图4 LSTM—LOWESS模型设计思路
图5 时间步长示意
图6 天然气居民客户的用气量预测误差
图7 16个用气量异常的居民客户
表1 预处理后的数据样例
表2 LSTM的结构
表3 LSTM—LOWESS模型伪代码
表4 LSTM—LOWESS模型阈值(MAE)
作者简介
宫雨 ,男,山东蓬莱人,副教授,硕士生导师,主要研究方向为数据挖掘、能源数据分析、企业信息化。
作者简介
曹馨
《煤炭经济研究》青年编委
引用来源
宫雨,李倩,曹馨. 基于深度学习的天然气居民客户用气量异常检测[J]. 煤炭经济研究,2024,44(7):27-34.