沈阳市环境空气质量统计预报应用及效果评估于晓东1,纪欣彤1,王 闯2
(1. 沈阳环境科学研究院,辽宁 沈阳 110167;
2. 辽宁省沈阳生态环境监测中心,辽宁 沈阳 110167)
摘 要: 基于沈阳市统计预报中逐步回归及简易逐步回归模型,利用2017年环境空气主要污染物自动监测实况数据,采用相关系数、标准化平均偏差等指标检验2种模型的预报效果。结果显示:逐步回归及简易逐步回归模式均能够较好的表征污染变化趋势,2种预报模式预报对AQI均表现出春夏季优于秋冬季特点。逐步回归、简易逐步回归模式24 h预报效果优于48和72 h。其中简易逐步回归模式24 h级别准确率达到67%。
关键词: 逐步回归;环境空气质量预报;准确率;沈阳市中图分类号: X51;X823文献标志码: ADOI:10.16803/j.cnki.issn.1004 − 6216.2020.04.019
Evaluation and Application of Statistical Prediction of
Ambient Air Quality in Shenyang City
YU Xiaodong1,JI Xintong1,WANG Chuang2
(1. Shenyang Academy of Environmental Sciences, Shenyang 110167, China;2. Shenyang Environmental Monitoring Center, Shenyang 110167, China)
Abstract: Based on the stepwise regression model and simple stepwise regression model, the statistical prediction results ofShenyang were tested by the correlation coefficient and the standardized average deviation with the automatic monitoring data ofmain pollutants in the ambient air in 2017. The results showed that the stepwise regression model and the simple stepwise regressionmodel could effectively characterize the change trend of the pollution. The prediction by the two models also showed that the airquality index (AQI) in spring and summer was better than that in autumn and winter. The prediction result in 24 h for both stepwiseregression model and simple stepwise regression model was better than that in 48 h and 72 h. The prediction accuracy rate by thesimple stepwise regression model in 24 h achieved 67%.
Keywords: Stepwise Regression;Prediction of Ambient Air Quality;Accuracy Rate;ShenyangCLC number: X51;X823
随着我国城市化进程的加速,社会经济的快速发展,工业化水平的提高,人类活动对环境产生的影响越来越大,城市环境空气质量污染日趋严重[1 − 2]。近年来,我国中东部地区重污染频发[3],保持高速经济发展的同时,又要保证良好的城市空气质量,人们对保护赖以生存的大气环境的紧迫感越来越强,开展环境空气质量预报工作,不仅是保护人民群众健康、动员公众参与环境保护的有效措施,也是提高人们生活质量,为公众及政府提供有价值的参考信息,具有十分重要的意义[4]。
目前,城市空气质量预报方法主要分为:数值预报方法和统计预报方法2种[5 − 6]。数值预报[7 − 9]
建立在污染物扩散模式基础上,需要详细的气象资料和污染源排放资料,用数值计算的方法直接求解物质守恒方程,或求解在各种近似条件下简化形势的物质守恒方程,以求得污染物浓度在环境介质中与界面上交换特征及其分布规律。数值预报以其完善的理论基础、合理的模型设计和定时定量的预报效果成为空气质量预报的主要发展趋势。统计预报方法[4,10 − 12]是在不了解事物变化机理的情况下,通过分析事物规律来进行的预报方法,具有不依赖物理、化学及生物过程以统计学方法实现预测的特点。尽管缺少确定性污染机理,但简单有效。综合考虑国内目前城市现有资料、资源及预报准确
收稿日期:2020 − 01 − 10
作者简介:于晓东(1985 − ),男,硕士、工程师。研究方向:环境科研、医疗废物处理与处置。E-mail:yuxiaodong@syhky.com引用格式:于晓东,纪欣彤,王 闯. 沈阳市环境空气质量统计预报应用及效果评估[J]. 环境保护科学,2020,46(4):107 − 112.
108环境保护科学第 46 卷
率等多方面因素,统计预报仍是当前空气质量短期预报的一种有效方法[13 − 15]。
沈阳市环境空气质量预报属于小尺度、短期预报,采用最多的预报方法是统计预报方法。本文主要介绍沈阳市统计预报方法中的逐步回归法,包括逐步回归法原理、关键参数的筛选和方程的建立,并评估该方法在应用中的准确率。
程,以此回归方程为依据进行外推计算,从而获得未来某项大气污染物浓度的预报结果。通常当气象条件有利于污染物扩散时,大气污染物浓度降低,反之则浓度升高。1.1 关键参数筛选
通过对空气质量和气象条件历史观测数据的统计分析,寻找对大气污染物浓度变化影响显著的气象和非气象关键参数,由于气候条件、地形、人口数量和污染物本底浓度等差异,导致不同地区关键参数有所不同。关键参数列入回归方程中的同时,在回归方程应用一段时间后,根据预报评估效果,判断导致预报偏差的影响参数,应对参数适时进行优化或补充。
沈阳市统计预报方法以11个监测站点的历史观测数据及气象数据为基础,共选取25个关键参数,具体见表1。
参数说明
1 预报方法介绍
污染物浓度的变化与多个气象或非气象参数有关,通常难以寻找与污染物浓度预报值线性关系显著的单个参数,因而统计预报中的回归分析一般采用多元线性回归法,即从气象条件和非气象条件中筛选出对大气污染物浓度变化具有显著影响的若干关键参数,通过统计分析得到多元线性回归方
表 1 关键参数及其说明
参数名称前一日污染物浓度
天气形势风向平均风速24 h风速变量最低气温最低气温24 h变量
最高气温最高气温24 h变量最高最低气温平均最高最低气温平均24 h变量
08时温度850 mb08时温度850 mb08时温度24 h变量
850 mb08时逆温
20时温度850 mb20时温度850 mb20时温度24 h变量
850 mb20时逆温925 mb08时温度925 mb08时温度24小时变量
925 mb08时逆温925 mb20时温度925 mb20时温度24 h变量
925 mb20时逆温
参数单位μg·m−3mg·m−3
−−m·s−1m·s−1℃℃℃℃℃℃℃℃℃℃℃℃℃℃℃℃℃℃℃℃
反映预报地区污染物浓度基础,用来消除污染源的变化对污染物浓度的影响,增加回归方程的稳定性定性
反映预报地区上空天气系统的变化及性质
反映预报地区水平方向气流的运动方向反映预报地区天气系统的性质和强弱反映预报地区天气系统与前一日强弱变化
反映预报地区冷暖气团的性质
反映预报地区冷暖气团与前一日相比的变化程度
反映预报地区冷暖气团的性质
反映预报地区冷暖气团与前一日相比的变化程度
反映预报地区冷暖气团的性质
反映预报地区冷暖气团与前一日相比的变化程度
反映预报地区08时冷暖气团的性质反映预报地区08时高空冷暖气团的性质
反映预报地区高空08时冷暖气团与前一日相比的变化程度
反映预报地区08时垂直方向扩散条件反映预报地区20时冷暖气团的性质反映预报地区20时高空冷暖气团的性质
反映预报地区高空20时冷暖气团与前一日相比的变化程度
反映预报地区20时垂直方向扩散条件反映预报地区08时高空冷暖气团的性质
反映预报地区高空08时冷暖气团与前一日相比的变化程度
反映预报地区08时垂直方向扩散条件反映预报地区20时高空冷暖气团的性质
反映预报地区高空20时冷暖气团与前一日相比的变化程度
反映预报地区20时垂直方向扩散条件
1.2 逐步回归法方程建立
统计预报模型采用逐步回归算法,逐步回归算
法是在所有考虑的参数中,按其对因变量Y(大气污染物预报浓度)影响的显著程度的大小,由大到小
第 4 期于晓东 等:沈阳市环境空气质量统计预报应用及效果评估109
逐个引进回归方程。若已被引进回归方程的参数,在引进新参数后,往往可能会由显著变为不显著,此时需将其从回归方程中剔除,以保证在众多预报参数中挑选出最佳的关键参数组合,建立最优预报方程。预报浓度Y与预报关键参数X建立的最优回归方程见式(1)。
Y=B0+B1X1+B2X2+......+BnXn(1)1.3 建模数据来源及评估方法
采用2017年沈阳市环境空气质量监测数据及气象资料,基于统计预报模型的原理,设计并构建简易和精准模型2种逐步回归模式。简易模式采样多元一次回归模型,精准模型采用多元一次逐步回归模型。
利用标准化平均偏差(NMB)、标准化平均误差(NME)和均方根误差(RMSE)等参数对预报模型进行评估。NMB反映的是各预报值与实况值的平均偏离程度,NME反映的是平均绝对误差,NMB、NME是2个没有量纲的统计量,反映了预报值与实况值之间相对偏差和误差的大小,一般情况下,统计量均小于50%,认为模型预报结果较好;RMSE反映预报值与实况值的偏离程度,为有量纲的统计量,越接近0,表明预报结果越准确[15]。
式(1)中:Y为污染物预报浓度,B0 为常数项,X1、X2、……、Xn为预报关键参数,B1、B2、……、Bn为关键参数的系数。
根据沈阳市气候特点,利用历史气象数据及监测数据,以历年同期该月数据及当年该月月初至预报日期前一日数据为基础,每天增加新的污染物浓度和气象参数数据,以新的数据建立预报方程。全市6项污染物每日各建立1个方程,预测各污染物浓度,折算出各污染物的空气质量分指数,选择最大分指数为当日空气质量指数,并确定首要污染物。各项污染物方程每日滚动更新,建立统计模式的动态更新机制,克服统计预报模型在污染源发布变化或天气类型发生变化时产生的较大误差,在实际预报中,采取每天增加新的污染物监测资料和气象资料,建立最新的模型并进行预报,不断按最新数据建立统计关系,使预报准确性得到提高。
2 预报结果评估及应用
2.1 统计模型AQI预报结果评估
为评估2种统计模型对AQI的预报结果,将2017年划分为春(3~5月)、夏(6~8月)、秋(9~11月)和冬(12月到次年2月)四季,从时间序列分析和统计2种模式系统预报结果,见图1;统计预报模式AQI预报统计参数,见表2。
图 1 2017年四季AQI预报结果对比
110
环境保护科学
表 2 统计预报模式AQI预报统计参数表
第 46 卷
AQINMB/%NME/%RMSE/%
R
逐步回归
春8.70028.50036.0000.652
夏9.4028.9036.000.65
秋49.30059.20051.0000.266
冬22.30044.00054.0000.415
春−8.30030.10046.0000.316
简易逐步回归夏−6.10035.50043.0000.116
秋27.70050.60052.0000.308
冬24.70043.90059.0000.511
注:NMB,利用标准化平均偏差;NME,标准化平均误差,RMSE,均方根误差。
四季中2个预报模型对AQI预报结果随时间变化趋势与实况值基本一致,逐步回归模式预报值比简易逐步回归模式偏高,其中夏季偏高更明显。春夏季逐步回归预报效果更好,表现为相关系数R均大于0.65。四季中逐步回归、简易逐步回归模型的NMB为8.7%~49.3%、−8.3%~27.7%,NME为28.5%~59.2%、30.1%~50.6%。其中,两种模式除秋季外,NMB及NME均小于50%,预报效果较好。两种模式RMSE值显示春夏季低于秋冬季,综合多个指标逐步回归及简易逐步回归模式预报效果均表现出春夏季优于秋冬季。2.2 统计模型污染物浓度预报准确率评估
利用2017年逐步回归模式及简易逐步回归模式所生成的预报值与实况值对比,预报结果在实况值两侧不同区间的分布情况可以说明与实况值的接近程度[16],预测值在实况值两侧不同区间的分布
情况汇总见表3。
表2可见,逐步回归模式NO2预报值在不同区间内出现比例为6项污染物中最高,其次为PM10、O3。其中57.5%的NO2的预报值出现在实况值的±40%的区间内,48.9%、43.9%的PM10及O3的预报值出现在实况值的±50%区间内。SO2、PM2.5和CO的预报值在实况值的±40%、±50%区间出现的比例均小于40%。简易逐步回归法中,NO2、O3预报值比例在不同区间内出现比例较高,PM10次之,其中71.9%的NO2的预报值及70.6%的O3的预报值出现在实况值的±40%区间内,47.6%的PM10的预报值出现在实况值的±40%区间内,SO2、PM2.5和CO的预报值在实况值的±40%区间出现的比例均小于40%。2种预报模式对NO2、PM10和O3预报结果优于SO2、PM2.5和CO。
±40%19.057.537.632.116.338.033.371.947.637.731.270.6
±50%26.269.248.940.319.943.941.181.455.845.039.080.1
±60%32.681.960.650.231.252.046.888.764.154.553.285.7
±70%42.189.170.659.341.656.651.997.068.861.565.489.2
±80%48.495.574.272.448.964.355.499.172.768.475.891.8
±90%50.297.376.581.049.868.858.099.175.871.977.994.4
样本数/个221221221221221221231231231231231231
表 3 预测值在实况值两侧不同区间的分布情况
预报方法
预报项目SO2NO2
逐步回归
PM10PM2.5COO3SO2NO2
简易逐步回归
PM10PM2.5COO3
±10%5.09.510.48.14.110.48.216.013.410.47.421.2
±20%10.425.319.914.09.021.315.230.325.519.913.442.0
±30%14.542.131.720.413.630.822.554.536.830.323.858.4
对比2种预报模型,PM10、PM2.5的2项实况值在±70%、±80%和±90%区间内逐步回归法预报
第 4 期于晓东 等:沈阳市环境空气质量统计预报应用及效果评估111
值比例高于简易逐步回归法,其他各个区间内六项污染物预报结果中简易逐步回归法的预报值比例均高于逐步回归。
在污染物浓度分布区间基础上,进一步统计了实况值与预报值的NMB、NME和RMSE,结果见表4。
表 4 统计预报模式6项污染物浓度预报统计参数表
NMB/%
污染物
春
SO2NO2PM10COO3
逐步回归夏
秋
冬
春
简易逐步回归夏
秋
冬
春
逐步回归夏
秋
冬NME/%
简易逐步回归春
夏
秋
冬
逐步回归春夏秋冬
RMSE/%
简易逐步回归春
夏19940
秋281257
冬891770
28.228−12.7147.459.267.980.29085.98557.4149.17184.288.895.536351813231
−60.2−59.9−17.67.4−49.6−11.7−13.2−8.6
23.539.322.528.620.6−1.4−17
61.160.929.237.751.221.625.228.8292914242543.142.873.453.54860.455.949.46161737572
−6.5−6.414.328.1101.899.147.689.7
40.4156.3154.581.896.242.655.664.385.11.61.611.4
35
35
0.50.50.71.3
27.727.9100.918.4−11.9−16.113.4−6.8
2.7−43.343.838.821.7
100.941.516.229.536.937.15252833024.154.534.225.6
30
45
51
PM2.5−58.6−58.3−39.477.977.461.553.366.976.977.252.16362334957
注:NMB,利用标准化平均偏差;NME,标准化平均误差;RMSE,均方根误差。
计算结果显示,逐步回归模式中:秋、冬季NO2的NMB为−17.6%、7.4%,NME为29.2%、37.7%;春、夏季PM10的NMB为−6.5%、−6.4%,NME为43.1%、42.8%;春、夏和冬季的O3的NMB为18.4%~27.9%,NME为35.0%~41.5%,均小于50%,表明上述预报效果较其他时段更好。简易逐步回归模式中:夏、秋、冬NO2的NMB为−13.2%~−8.6%,NME为21.6%~28.8%;春、冬季PM10的 NMB为23.5%、28.6%,NME为48.0%、49.4%;四季O3的NMB为−16.1%~13.4%,NME为16.2%~37.1%,均小于50%,表明上述时段内污染物预报效果优于其他。2种预报模式中冬季SO2的RMSE明显高于其他三季,说明预报值与实况值偏差较大,可能与冬季供暖燃煤污染物排放量增加有关。说明预报值与实况值偏差较大,可能与冬季供暖燃煤污染物排放量增加有关。
2.3 统计模型实际应用中准确率统计
采用2种方式评估统计预报的准确率。第1种为级别预报准确率,即预报级别与实测污染物浓度级别一致为正确,否则为错误;第2种为首要污染物准确率,即实际出现的首要污染物与预报中首要污染物一致为正确,否则为错误。
应用逐步回归、简易逐步回归模式预报2017年沈阳市AQI,统计24、48、72 h时效预报级别准确率、范围准确率和首要污染物准确率见表5。
逐步回归、简易逐步回归模式24 h级别、首要污染物预报均优于48和72 h预报。48、72 h预报
准确率相差不大。简易逐步回归不同时效的级别准确率均高于60%,逐步回归24 h级别准确率超过50 %,48、72 h级别准确率接近50 %。综上简易逐步回归在3个预报时效的级别准确率高于逐步回归,而逐步回归在3个时效的首要污染物准确率高于简易逐步回归。
表 5 逐步回归、简易逐步回归模式在实际应
用中准确率统计
%
预报时效/h
244872
逐步回归级别首要污染物54.449.849.5
44.241.442.1
简易逐步回归级别67.062.664.3
首要污染物
38.739.633.5
3 结论与建议
3.1 结论
1)利用2017年沈阳市环境空气质量监测数据及气象资料,沈阳市共选取25个关键参数,设计并构建简易和精准模型2种逐步回归模式。
2)2种统计模型对AQI的预报结果显示:春夏季预报效果更好。
3)2种统计模型的实际应用中,逐步回归、简易逐步回归模式24 h级别、首要污染物预报均优于48和72 h预报,级别准确率优于首要污染物准确率。3.2 建议
空气质量统计预报方法建立在污染物浓度变化主要受气象等因素影响的假设条件下,无需掌握
112环境保护科学第 46 卷
污染源排放状况。但统计预报的时间精度、时间长度和空间尺度上均有局限性。预报准确率有较大提升空间,为进一步提升预报结果准确率,可从以下4方面着手。
1)由于多元线性回归方法本身的限制,统计预报模式输出的预报结果接近建模使用的污染物浓度平均水平,建议使用最新观测资料及时修正预报方程。同时,通过总结不同时期出现高浓度和低浓度的天气形势对预报方程输出的结果进行修正,提高预报准确率。
2)为了克服统计预报模型在污染源发布变化或天气类型发生变化时产生的较大误差,在实际预报中,宜采取每天增加新的污染物监测资料和气象资料,建立最新的模型并进行预报。
3)多种统计预报方法或统计预报与数值预报等可结合使用,查漏补缺,取长补短,可有效提高预报的适用性和准确率。
4)日常工作中做到统计预报与主观订正相结合,统计预报模型自动计算生成的预测结果,受到预报模式本身设置及性能的限制,预报员结合辅助资料及经验对预测结果做出修正、优化,提高预报结果的准确率。参 考 文 献
[1] 周秀杰, 苏小红, 袁美英. 基于BP网格的空气污染指数预报研
究[J]. 哈尔滨工业大学学报, 2004, 36(5): 582 − 585.
[2] 喻雨知, 王体健, 肖波, 等. 长沙市两种空气质量预报方法检验
对比[J]. 长江流域资源与环境, 2007, 16(4): 509 − 513.[3] 任阵海, 万本太, 苏福庆, 等. 当前我国大气环境质量的几个特
征[J]. 环境科学研究, 2004, 17(1): 1 − 6.[4] 魏璐, 朱伟军, 陈海山. 郑州市空气质量统计预报方法探讨[J].
南京气象学院学报, 2009, 3(2): 314 − 320.[5] 张朝能, 胡冰. 空气质量预报方法综述[J]. 云南环境科学, 2003,
22(2): 55 − 57.[6] 朱玉强. 几种空气质量预报方法的预报效果对比分析[J]. 气象,
2004, 30(10): 30 − 33.
[7] 程念亮, 李红霞, 孟凡, 等. 山东省空气质量预报平台设计及其
预报效果评估[J]. 环境污染与防治, 2015, 37(9): 92 − 99.[8] 符春. 数值预报方法在广州空气质量预报中的应用[J]. 环境科
学与管理, 2006, 31(7): 161 − 165.
[9] 王茜, 伏晴艳, 陆涛, 等. 数值模式在上海市空气质量预报中的
应用研究[C]. 中国环境科学学会2009年学术年会论文集(第
二卷), 北京: 2009: 1016 − 1021.
[10] 姜有山, 陈飞, 班欣, 等. 连云港市城市空气质量预报方法研
究[J]. 气象科学, 2007, 27(2): 220 − 225.[11] 王庆梅, 张雪, 梅韩光. 兰州市大气污染特征与污染预报技术
研究[J]. 中国环境监测, 2008, 24(3): 56 − 62.[12] 徐大海, 朱蓉. 大气平流扩散的箱格预报模型与污染潜势指数
预报[J]. 应用气象学报, 2000, 11(1): 1 − 12.[13] 韩志伟, 张美根, 雷孝恩, 等. 城市空气污染数值预报试验[J].
气候与环境研究, 1999, 14(3): 283 − 290.[14] 林楚雄, 陈嘉晔, 李红霞, 等. 深圳市PM2.5浓度特征及统计预
报研究[J]. 环境工程, 2017, 35(5): 87 − 92.[15] 曾钰, 黄钟霆, 彭庆庆. 基于全国清单CMAQ模型预报适用性
研究[J]. 绿色科技, 2015(8): 213 − 215.
[16] 刘闽, 王帅, 林宏, 等. 沈阳市冬季环境空气质量统计预报模式
建立及应用[J]. 中国环境监测, 2014, 30(4): 10 − 15.
因篇幅问题不能全部显示,请点此查看更多更全内容