创新点
本研究提出了一种基于哈里斯鹰优化算法(HHO)、卷积神经网络(CNN)和长短期记忆神经网络(LSTM)相结合的空气质量预测修正模型,对区域多尺度空气质量模型(CMAQ)的预测结果进行修正,显著提高了CMAQ模型对上海市大气污染物浓度预报的准确性。此外,针对优化算法的局部最优问题,本研究利用高斯随机游走策略实现了哈里斯鹰算法的改进,有效提高了算法的性能。该研究将人工智能技术与传统空气质量模型相结合,建立了一个具有更强适用性的空气质量预测模型,为区域大气污染物防治提供技术支撑。
作者简介
基于HHO-CNN-LSTM的CMAQ修正模型及其在上海市空气质量预报中的应用
作者
郑鑫楠1,林开颜2,王孜竞1,宋远博1,师洋1,路函悦1,张亚雷2,3,沈峥2,*
单位
1. 同济大学 电子与信息工程学院
2. 同济大学 新农村发展研究院
3. 同济大学 环境科学与工程学院
基金项目
1. 国家重点研发计划政府间国际合作资助项目(2022YFE0120600)
2. 国家自然科学基金面上资助项目(21978224)
识别上方二维码获取全文
摘要
建立空气质量预报模型,预测污染物浓度对人类健康和社会经济发展具有重要意义。然而,传统的空气质量模型 CMAQ 对污染物浓度的预报精度并不理想。 对此,本文提出了一种基于卷积神经网络(CNN)和长短期记忆神经网络(LSTM)的空气质量预报修正模型,并使用哈里斯鹰算法(HHO)对模型的超参数进行优化;用CMAQ 模型对上海市2022 年12月六种大气污染物(SO2、NO2、PM10、PM2.5、O3、CO)浓度的预报数据以及监测站的气象数据和污染物浓度实测数据作为HHO-CNN-LSTM模型的输入,对CMAQ模型预报结果进行修正。 使用均方根误差(RMSE)、平均绝对误差(MAE)和一致性指数(IOA)作为评价指标。 结果显示,修正模型显著提高了六项污染物浓度的预测精度,MSE减少了73.11%~91.31%,MAE减少了67.19%~89.25%,IOA提升了35.34%~108.29%。同时针对HHO算法陷入局部最优而导致修正模型对CO浓度预度。 相比于改进之前,RMSE减少了39.55%,MAE减少了45.93%,IOA提高了32.43%。
研究背景
大气环境污染物一般是由二氧化硫(SO2)、氮氧化物(NOx)、臭氧(O3)、一氧化碳(CO)等工业生产废物,以及PM10、PM2.5等固体粒子组成。这种污染物会引发肿瘤等各种病症,严重危害人们健康。随着中国经济社会发展和人民生活水平的提升,大气环境污染已成为我国目前存在的主要大气环境问题之一。因此,建立空气质量模型预测污染物的浓度对人类健康和环境管理具有重要意义。
目前传统的空气质量模型以区域多尺度空气质量模型(CMAQ)为代表,用数学方程模拟污染物传播时的物理化学反应机制,充分考虑了实际环境中污染物相互之间的变化与影响,因此得到广泛的应用。例如,ZHENG等用非均相化学更新的CMAQ模型研究中国北方次生无机气溶胶的形成;ZHE等使用CMAQ模型分析2013年严重雾霾期间河北源部地区和其他地区PM2.5的排放量;HU等使用WRF-CMAQ模型,对2013年中国的臭氧和颗粒物进行了模拟;NAPELENOK等使用CMAQ-ISAM模型研究十余种生物质燃烧对美国东南部PM2.5浓度的影响;KOO等使用WRF-CMAQ模型预测了韩国首尔地区的PM10污染事件发生的时间和污染物的传输路径;WANG等利用WRF-CMAQ模型模拟了香港地区O3在不同海拔地区的分布浓度以及其形成、扩散的物理化学过程。
CMAQ模型的预报需要将污染源排放清单作为数据输入,由于污染源种类繁多、分布面广和变化复杂,所以排放清单的编制工作需要较长的时间以及较多的人力,其制作过程决定了排放清单无法满足实时更新的要求;另外,CAMQ模型是基于“一个大气”的核心概念建立的,而人们对于大气这个异常复杂的系统的了解十分有限,无法对其中所有的大气传输、污染物扩散和化学反应等过程进行量化处理;污染源位置和高度、大气稳定度以及人口、燃料构成等对大气质量的影响和作用往往是非线性的,在应用偏微分方程来描述这些非线性作用时,又使用了大量的近似方法来简化求解过程。这些都是CMAQ模型的预测结果存在偏差的主要原因。为提高CMAQ模型预报能力,利用监测数据对模型预报结果进行统计修正的方法应用也较为普遍。谢敏等尝试将监测数据直接作为预报初始值,结合CMAQ模型预报的增减量建立修正方法;王茜等利用线性回归方法建立预测数据与监测数据之间的关系,降低了由于污染源不确定性产生的预报偏差;芦华等使用多元线性回归方法对CMAQ模型的预报结果进行滚动订正,有效提高了模型的预报效果。SAYEED等利用深度卷积神经网络(DCNN)对CMAQ模型进行修正和扩展,提高了模型在颗粒物浓度预测上的准确性。
近年来,由于人工智能的应用,不少深度学习算法也逐渐发展,如深度信念网络(DBN)、卷积神经网络(CNN)和循环神经网络(RNN)等。相比于传统的统计方法,深度学习算法能够处理更多非线性、非结构化的数据,具有更好的性能。一些研究人员已将其应用于空气质量研究,YI等提出了一种基于深度神经网络的PM2.5浓度预测模型,使用卷积神经网络和循环神经网络进行特征提取和序列建模,并引入了注意力机制和残差连接以增强模型的表达能力;XAYASOUK等提出了一种基于深度自编码器(DAE)和长短期记忆网络(LSTM)的空气污染物浓度预测方法,使用DAE对输入特征进行降维和特征提取,然后利用LSTM对时间序列数据进行预测;PAK等提出了一种基于卷积神经网络和长短期记忆神经网络的混合模型(CNN-LSTM)用于预测臭氧浓度,并证实具CNN-LSTM模型具有误差小、训练时间短的优点。双向长短期记忆神经网络组成的混合CNN-BiLSTM模型,多个一维卷积神经网络用于提取多个监测站的空间相关性特征,双向长短期记忆神经网络可以学习时间序列数据过去和未来的特征,从而进行更有效的预测。
上述研究表明,CNN-LSTM模型在大气污染物浓度预测方面具有较好的性能。在此基础上,利用哈里斯鹰优化算法(HHO)寻找CNN-LSTM模型的最优超参数,可以使模型拥有更好的预测效果。本文将会在CMAQ模型对上海市污染物浓度进行预测的基础上,使用深度学习方法构建基于HHO-CNN-LSTM的修正模型。将CMAQ模型的预报数据以及影响污染物浓度的气象数据和污染物浓度实测数据作为HHO-CNN-LSTM模型的输入,进行污染物浓度再预测,从而实现对CMAQ模型预报结果的修正。
部分图片
图3 CO浓度预测结果
引文格式
郑鑫楠,林开颜,王孜竞,宋远博,师洋,路函悦,张亚雷,沈峥.基于HHO-CNN-LSTM的CMAQ修正模型及其在上海市空气质量预报中的应用[J/OL].能源环境保护:1-10[2023-11-21].https://doi.org/10.20078/j.eep.20231107.