本发明涉及环保监测,具体为一种基于多源时空数据融合的空气质量预测方法及系统。
背景技术:
1、环保行业中,需要从空气质量监测站中获取数据进行分析。一般有常规的大气6参数(pm2.5、pm10、o3、so2、nox、co)及气象5参数(温度、气压、湿度、风向、风速)。
2、目前国家对于环境空气质量监控,主要有两种监测站,国控站与小型站。国控站的优势为监测数据可靠,但存在价格昂贵、覆盖范围有限等局限性。小型站成本较低、操作简便,不足之处是监测数据比较粗略。
3、数据同化是将不同时刻、不同类型、不同来源、不同分辨率的气象数据以及背景场生成时间、空间和物理一致性的数据集,在提高数值大气预报精度方面,特别是降雨预报,有非常重要的作用。但现有技术对多种数据同时同化的情况较少,也没有一种衡量和选取同化数据的方法。这使数据同化具有很大局限性,不能完全体现各种数据的优势,使得预测数据缺乏精度和可靠性。
技术实现思路
1、针对现有技术的不足,本发明提供了一种基于多源时空数据融合的空气质量预测方法及系统,解决了现有技术缺少对多种数据同化以及衡量和选取同化数据的方法,导致预测数据缺乏精度和可靠性的问题。
2、为实现以上目的,本发明通过以下技术方案予以实现:一种基于多源时空数据融合的空气质量预测方法,包括以下步骤:
3、s1、运用激光雷达实时获取垂直廓线数据,然后再收集国家气象中心的地面常规监测网平面实时数据和卫星遥感平面实时数据;
4、s2、将三种收集到的多源数据补充到数据集,建立时空污染物立体分布图;
5、s3、同时将多源数据输入到wrf-chem和cmaq结合的数值模型,采用二次开发的源gs i同化系统,使化学模块的地面同化扩展到空间任一位置进行3d-var同化方法处理,完成激光雷达三维立体监测数据的同化过程,给出经过立体观测数据约束的颗粒物再分析场,得到数据集。
6、优选的,所述雷达检测点范围:垂直3km,范围100km,型号为拉曼激光雷达,雷达为颗粒物激光雷达、臭氧激光雷达。
7、优选的,数据集通过resnet提取地理环境特征(高度、经纬度、温度、湿度、工业区、人口密度等)据地理信息计算出空间权重矩阵,反映空间位置、距离和相似度等因素,将数据输入sgwr模型(空间地理加权回归模型)中,进行数据加权回归分析,分析空气质量的空间组织,预测相关因素,成功构建了3d空间特征回归模型,并将卫星遥感的图像数值数据与同化后数据结合提供给空间地理加权回归模型作为污染物预测模型的参数变量。
8、优选的,运用lstm与cnn相结合的模型,首先使用cnn卷积捕捉空间特征的局部信息和结构信息,池化层降维保留主要显著特征,再使用lstm对时间序列的长期依赖关系建模,捕获时间序列信息,预测序列批次值对模型的时间序列信息进行学习,最后将两者结合,生成相对于空间特征和时间的预测网络模型,输入高精度数据集并通过使用自适应矩估计(adam)优化器进行参数优化。
9、优选的,gs i同化系统的算法的具体过程是,通过求解一个最小二乘问题,将气象观测数据分析到数值预报模型的控制变量场上,得到一个空间分辨率比观测数据更高、时间分辨率更频繁的分析场,以及对应的分析误差协方差矩阵,这个分析场和协方差矩阵可以用来初始化下一次数值预报模型的预报场。
10、优选的,lstm-cnn模型处理数据过程:数据经过卷积神经网络(cnn)的处理,数据先经过卷积层捕捉空间特征,在经过池化层降维减少计算成本保留主要特征,所有特征融合后得到卷积神经网络的特征描述,然后reshape成lstm处理的类型,此时传递数据给lstm,lstm得到新的输入后,确定需要保持与丢弃的数据,借助s i gmo i d激活函数完成,然后获取数据的时间序列信息,最终预测出空气质量数据。
11、优选的,模型训练集、验证集和测试集的比例为80%:10%:10%。
12、优选的,cnn提取的特征是空气中的温度,湿度,风速,风向。
13、优选的,adam算法学习率设为0.01。
14、一种多源时空数据融合的空气质量预测系统,包括多源数据收集模块、多源数据融合模块和预测模块;
15、多源数据收集模块用于收集激光雷达实时获取的垂直廓线数据、国家气象中心的地面常规监测网平面实时数据以及卫星遥感平面实时数据;
16、多源数据融合模块用于通过resnet提取地理环境特征,据地理信息计算出空间权重矩阵,将数据输入sgwr模型进行数据加权回归分析,分析空气质量的空间组织,预测相关因素,成功构建了3d空间特征回归模型,同时运用lstm与cnn相结合的模型,生成相对于空间特征和时间的预测网络模型;
17、预测模块用于将多源数据输入到wrf-chem和cmaq结合的数值模型,采用二次开发的源gs i同化系统给出经过立体观测数据约束的颗粒物再分析场
18、本发明提供了一种基于多源时空数据融合的空气质量预测方法及系统。
19、具备以下有益效果:
20、1、本发明通过resnet提取地理环境特征计算出空间权重矩阵,并将数据输入sgwr模型(空间地理加权回归模型)中,进行数据加权回归分析,分析空气质量的空间组织,预测相关因素,成功构建了3d空间特征回归模型。并将卫星遥感的图像数值数据与同化后数据结合提供给空间地理加权回归模型作为污染物预测模型的参数变量,实现从公里级到百米级的精度跃升。
21、2、本发明运用lstm与cnn相结合的模型,首先使用cnn卷积捕捉空间特征的局部信息和结构信息,池化层降维保留主要显著特征,再使用lstm对时间序列的长期依赖关系建模,捕获时间序列信息,预测序列批次值对模型的时间序列信息进行学习,最后将两者结合,生成相对于空间特征和时间的预测网络模型,输入高精度数据集并通过使用自适应矩估计(adam)优化器进行参数优化,实现从小时级到分钟级的时空分辨率提升。
22、3、利用wrf-chem和cmaq结合的数值模型,采用二次开发的源gs i同化系统,使化学模块的地面同化扩展到空间任一位置进行3d-var同化方法处理,完成激光雷达三维立体监测数据的同化过程,给出经过立体观测数据约束的颗粒物再分析场,得到全国最大的高精度数据集。
1.一种基于多源时空数据融合的空气质量预测方法,其特征在于,包括以下步骤:
2.根据权利要求1所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,所述雷达检测点范围:垂直3km,范围100km,型号为拉曼激光雷达,雷达为颗粒物激光雷达、臭氧激光雷达。
3.根据权利要求1所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,数据集通过resnet提取地理环境特征(高度、经纬度、温度、湿度、工业区、人口密度等)据地理信息计算出空间权重矩阵,反映空间位置、距离和相似度等因素,将数据输入sgwr模型(空间地理加权回归模型)中,进行数据加权回归分析,分析空气质量的空间组织,预测相关因素,成功构建了3d空间特征回归模型,并将卫星遥感的图像数值数据与同化后数据结合提供给空间地理加权回归模型作为污染物预测模型的参数变量。
4.根据权利要求1所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,运用lstm与cnn相结合的模型,首先使用cnn卷积捕捉空间特征的局部信息和结构信息,池化层降维保留主要显著特征,再使用lstm对时间序列的长期依赖关系建模,捕获时间序列信息,预测序列批次值对模型的时间序列信息进行学习,最后将两者结合,生成相对于空间特征和时间的预测网络模型,输入高精度数据集并通过使用自适应矩估计(adam)优化器进行参数优化。
5.根据权利要求1所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,gsi同化系统的算法的具体过程是,通过求解一个最小二乘问题,将气象观测数据分析到数值预报模型的控制变量场上,得到一个空间分辨率比观测数据更高、时间分辨率更频繁的分析场,以及对应的分析误差协方差矩阵,这个分析场和协方差矩阵可以用来初始化下一次数值预报模型的预报场。
6.根据权利要求4所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,lstm-cnn模型处理数据过程:数据经过卷积神经网络(cnn)的处理,数据先经过卷积层捕捉空间特征,在经过池化层降维减少计算成本保留主要特征,所有特征融合后得到卷积神经网络的特征描述,然后reshape成lstm处理的类型,此时传递数据给lstm,lstm得到新的输入后,确定需要保持与丢弃的数据,借助sigmoid激活函数完成,然后获取数据的时间序列信息,最终预测出空气质量数据。
7.根据权利要求1所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,模型训练集、验证集和测试集的比例为80%:10%:10%。
8.根据权利要求4所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,cnn提取的特征是空气中的温度,湿度,风速,风向。
9.根据权利要求4所述的一种基于多源时空数据融合的空气质量预测方法,其特征在于,adam算法学习率设为0.01。
10.一种基于权利要求1所述方法的多源时空数据融合的空气质量预测系统,其特征在于,包括多源数据收集模块、多源数据融合模块和预测模块;
