一种基于图像特征组合的降水相似预报方法

allin2023-03-13  107



1.本发明涉及图像检索技术领域,尤其涉及一种基于图像特征组合的天气形势场降水相似预报方法。


背景技术:

2.降水情况对生产生活、社会经济、水利防汛等方面密切相关,对于降水情况的分析及预测一直是重要的服务工作,做好降水预报不仅关系到粮食安全,而且关乎国计民生,所以如何使降水预报更为客观化、定量化、准确化已成为天气预报业务中至关重要的内容,而相似预报方法是目前在降水预报中经常使用的方法。
3.相似预报的主要问题就是检索问题,目前,国内外的研究主要集中于相似性测度算法,现有的相似性测度算法在计算相似度的过程中都是使用逐个格点的距离计算的,但目前采用距离系数作为相似性测度的判据都是一种平均意义上的描述,将二维的数据展成一维的数据,仅仅考虑了要素场数值的相似性,缺少了对要素场形状特征与整体信息的考虑,这样在两个样本总体特征相似的情况下,很有可能因为少数差值过大或过小的样本点的影响,而使得结果不准确。此外,检索量也很庞大,检索时间很长。


技术实现要素:

4.发明目的
5.本发明提出一种基于图像特征组合的降水相似预报方法,其目的在于解决目前点对点的相似预报存在的准确率不高、检索速度慢的问题。
6.技术方案
7.一种基于图像特征组合的降水相似预报方法,其特征在于,按以下步骤执行:
8.步骤1:获取历史形势场数据:具体为海平面气压和500、700、850hpa标准等压面的基本量,包括位势高度、温度、纬向风速、经向风速、气压和比湿资料,以及相对应的历史实况数据,包括每个站点的降水量、能见度、风向风速的历史实况数据;
9.步骤2:获取数值预报资料中的实时预报场资料,具体为未来某时刻的预报形势场数据;
10.步骤3:选取相似时间与相似区域;
11.对于相似时间的选取,根据预报形势场的日期,选取历史上每一年同期的前后15天的时间作为查找范围;
12.对于相似区域的选取,以研究区域为核心、增加上游系统的相似范围,在进行形势场逐步过滤筛选时,分步进行大、中、小尺度的筛选;其中大尺度为经度25
°
、纬度20
°
跨度的长方形,中尺度为经度16
°
、纬度13
°
跨度的长方形,小尺度为经度8
°
、纬度6
°
跨度的长方形;
13.建立逐层过滤的相似预报流程计算相似程度,对大尺度高度场进行相似过滤,反映环流形势的相似程度;对中尺度高度场进行相似过滤,表征天气影响系统的相似程度;对小尺度的高度场、温度场进行相似过滤,反映关键区物理量的相似程度;
14.步骤4:提取历史形势场的多种特征,建立历史特征数据库;
15.步骤5:提取出预报形势场的各个特征,求出预报形势场的每个特征与历史特征数据库中对应的历史形势场特征之间的皮尔逊相关系数,将其作为子特征的相似距离;将每个子特征相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度,即将所有特征相结合,使多个特征共同决定检索结果;逐层过滤的过程中,每一层都使用形势场多个特征的相似距离的加权和衡量形势场之间的相似程度;
16.步骤6:根据求得的两个样本之间的相似程度,在历史形势场场数据中寻找与预报形势场数据最相似的10个个例,算出此10个个例对应时刻的实况数据中的降水量的加权和,将其作为当前时刻的多站点降水定量预报的结论。
17.所述步骤4中提取形势场的多种特征,包括分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征。
18.采用分块直方图提取形势场的特征,描述不同数值在整个形势场矩阵中所处的位置与所占的比重,将其作为形势场的全局特征,过程如下:
19.将形势场形成的天气图等面积划分为4
×
4的矩形区域,分块后采用累加直方图方法计算每一个分块的直方图,并将其串联到一起,得到一个特征向量,针对矩形区域中不同位置的信息的重要程度,调整各分块的权值大小,并保证所有权值之和为1。
20.采用方向梯度直方图的方法提取形势场的特征,使用方向梯度直方图提取形势场的局部梯度信息描述符,将其作为形势场的局部特征,过程如下:
21.将形势场数据划分为小的元胞,将同一元胞中所有梯度方向相同的格点累加计数,计算出该元胞的一维方向梯度直方图,将元胞组成块并归一化块内的所有元胞,再将所有块的hog描述子串联起来作为形势场的特征向量;
22.使用lle流形学习算法提取形势场的非线性降维特征,将高维形势场数据样本映射为低维数据;
23.所述步骤5中,提取出各个子特征后,计算预报形势场与历史形势场对应子特征之间的相似距离,再将每个子特征相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度。
24.将各个子特征的相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度,过程如下:
25.针对提取出的分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征计算预报形势场与历史形势场对应特征之间的皮尔逊相关系数,将其作为子特征的相似距离;得到各个特征的相似距离后,再使用公式(9)计算预报形势场样本u与历史形势场样本v的各个子特征相似距离的加权和,将其作为两个样本之间的相似程度,即将所有特征相结合,使多个特征共同决定检索结果;
26.f(u,v)=w1r1+w2r2+w3r3+w4r4ꢀꢀ
(9)
27.其中r1为根据分块直方图求得的相似距离,r2为根据方向梯度直方图求得的相似距离,r3为根据形势场等值线的特征求得的相似距离,r4为根据使用流形学习提取的非线性降维特征求得的相似距离,w1为r1对应的权重,w2为r2对应的权重,w3为r3对应的权重,w4为r4对应的权重并规定w的取值满足公式(10)
28.w1+w2+w3+w4=1
ꢀꢀ
(10)。
29.优点及效果:
30.本发明通过提取形势场的整体特征、局部特征、等值线的特征、非线性降维特征,针对提取出的特征做相似性度量,使多个特征共同决定检索结果,实现基于形势场的降水相似预报,提升了最终结果的准确率。此外,将历史形势场的低维特征提取出之后存入历史特征数据库,在计算相似度时直接对低维的特征做相似度量,提高了检索速度。本发明可以用于气象领域中降水量的分析问题。
附图说明
31.图1是本发明的逐层过滤相似预报方案流程总图;
32.图2是本发明的基于特征优选的形势场相似检索流程图;
33.图3是本发明的形势场数据天气图;
34.图4是本发明的分块直方图;
35.图5是本发明的形势场的等值线图。
具体实施方式
36.一种基于图像特征组合的降水相似预报方法,其特征在于,包括以下步骤:
37.步骤1:获取历史形势场数据,具体包括欧洲中期天气预报中心数据逐日3小时(世界时)0.25
°×
0.25
°
再分析资料,包括海平面气压和500、700、850hpa标准等压面的基本量:位势高度、温度、纬向风速、经向风速、气压和比湿资料;以及相对应的历史实况数据,包括每个站点的降水量、能见度、风向风速的历史实况数据。基于此,建立时间深度为40年的历史资料库;
38.步骤2:获取欧洲中期天气预报中心(european center for medium weather forecasting,ecmwf)数值预报资料中的实时预报场资料,包括未来某时刻的预报形势场数据;
39.步骤3:相似时间与相似区域的选取
40.对于相似时间的选取,根据预报形势场的日期,选取历史上每一年同期的前后15天的时间作为查找范围,即每一天的预报对应历史上每年同一时间段的一个月的时间。
41.对于相似区域的选取,必须以研究区域为核心、适当增加上游系统的相似范围,在进行形势场逐步过滤筛选时,分步进行了大、中、小尺度的筛选。
42.建立逐层过滤的相似预报流程计算相似程度,对大尺度高度场进行相似过滤,用以反映环流形势的相似程度;对中尺度高度场进行相似过滤,用以表征天气影响系统的相似程度;对小尺度的高度场、温度场进行相似过滤,主要反映关键区物理量的相似程度。
43.步骤4:提取历史形势场的多种特征,包括分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征,建立历史特征数据库。
44.步骤5:提取出预报形势场的各个特征,求出预报形势场的每个特征与历史特征数据库中对应的历史形势场特征之间的皮尔逊相关系数,将其作为子特征的相似距离。将每个子特征相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度,即将所有特征相结合,使多个特征共同决定检索结果。逐层过滤的过程中,每一层都使用形势场多个特征的相似距离的加权和衡量形势场之间的相似程度。
45.步骤6:根据求得的两个样本之间的相似程度,在历史形势场场数据中寻找与预报形势场数据最相似的10个个例,算出此10个个例对应时刻的实况数据中的降水量的加权和,将其作为当前时刻的多站点降水定量预报的结论。
46.所述步骤4中提取形势场的多种特征,包括分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征。
47.采用分块直方图的方法提取形势场的特征,使用分块直方图来描述不同数值在整个形势场矩阵中所处的位置与所占的比重,将其作为形势场的全局特征,过程如下:
48.首先将形势场形成的天气图等面积划分为4
×
4的矩形区域,分块后采用累加直方图方法计算每一个分块的直方图,并将其串联到一起,就会得到一个特征向量,为了突出形势场中间的主体部分,将中心区域四个分块的权值加大,并保证所有权值之和为1。
49.采用方向梯度直方图的方法提取形势场的特征,使用方向梯度直方图提取形势场的局部梯度信息描述符,将其作为形势场的局部特征,过程如下:
50.将形势场数据划分为小的元胞,将同一元胞中所有梯度方向相同的格点累加计数,计算出该元胞的一维方向梯度直方图,为了保证一定的平移不变性,需要将元胞组成更大的块并归一化块内的所有元胞。得到的块描述符就叫做方向梯度直方图(histogram of oriented gradient,hog)描述子,再将所有块的hog描述子串联起来作为形势场的特征向量。
51.使用局部线性嵌入(locally linear embedding,lle)流形学习算法提取形势场的非线性降维特征,将高维形势场数据样本映射为低维数据。降维有助于减少计算量,利于分析数据规律,并且去除冗余特征。
52.所述步骤5中,提取出各个子特征后,计算预报形势场与历史形势场对应子特征之间的相似距离,再将每个子特征相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度。
53.将各个子特征的相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度,过程如下:
54.针对提取出的分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征计算预报形势场与历史形势场对应特征之间的皮尔逊相关系数,将其作为子特征的相似距离。得到了各个特征的相似距离后,再使用公式(9)计算预报形势场样本u与历史形势场样本v的各个子特征相似距离的加权和,将其作为两个样本之间的相似程度,即将所有特征相结合,使多个特征共同决定检索结果。
55.f(u,v)=w1r1+w2r2+w3r3+w4r4ꢀꢀ
(9)
56.其中r1为根据分块直方图求得的相似距离,r2为根据方向梯度直方图求得的相似距离,r3为根据形势场等值线的特征求得的相似距离,r4为根据使用流形学习提取的非线性降维特征求得的相似距离,w1为r1对应的权重,w2为r2对应的权重,w3为r3对应的权重,w4为r4对应的权重并规定w的取值满足公式(10)。
57.w1+w2+w3+w4=1
ꢀꢀ
(10)
58.以下介绍的是作为本发明所述内容的具体实施方式,下面通过具体实施方式对本发明所述内容作进一步的解释说明。
59.所描述下列具体实施方式只为示例本发明的不同的内容,不应理解为限制本发明
的范围。
60.相似预报是将基于数值预报产品构造出的未来某时刻的大气状态与历史上历年相应时间段之内曾出现过的大气状态逐个比较分析,从中找出若干个最相似的历史个例,并以此为依据分析制作天气预报。
61.如图1所示,提出了一种基于图像特征组合的相似预报方法,该方法提取了形势场的分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征,针对提取出的特征做相似性度量,最后将上述每个子特征相似距离的加权和作为两个形势场之间的距离,即将所有特征相结合,使多个特征共同决定检索结果,进而得到相似个例排序,在逐层过滤的过程中,每一层都使用以上检索方案得到多个相似个例,最终实现基于形势场的相似预报。
62.形势场相似预报要求两个相似场在形状和特征上尽可能的接近。由于每个形式场都是个二维矩阵,有和单通道图像相似的特征和结构,所以可以利用图像检索的思想,把针对形势场矩阵的相似检索问题转化为类似图像检索的问题。实现了针对形势场数据的特征提取、特征检索、确定并提供历史相似个例,基于特征优选的形势场相似检索流程如图2所示。离线阶段提取出历史形势场特征并将其存入数据库;在线阶段逐步引入不同的因子场,提取指定的预报因子场的特征,计算特征之间的相似距离,将每个子特征相似距离的加权和作为两个形势场之间的距离,最终得到相似个例排序,这些个例对应时刻的历史实况就可以作为当前时刻天气预报结论的依据,以此为依据实现基于形势场的相似预报。
63.每个形势场数据都可以表示为如图3所示的天气图,包含着丰富的气象信息,所有天气图都是以二维矩阵的形式存储的。经观察发现,天气图整体比较平滑,纹理特征和边缘特征较少,也没有确定的形状特点,但是不同位置的数值的分布是明显不同的。
64.针对天气图的以上特点,使用分块直方图来描述不同数值在整个形势场矩阵中所处的位置与所占的比重,将其作为形势场的全局特征。首先将形势场形成的天气图等面积划分为16块矩形区域,由于辽宁省处于矩形区域中心位置,相对于其他位置的信息比较重要,所以将图像中心点周围的四块作为中心区域,绘制了分块策略图如图4所示。
65.分块后采用累加直方图方法计算每一个分块的累加直方图,并把它作为该分块的特征,将得到的每个分块的特征串联到一起,就会得到一个特征向量。为了突出形势场中间的主体部分,针对矩形区域中不同位置的信息的重要程度,将中心区域四个分块的权值加大,并保证所有权值之和为1。这样的分块直方图,一定程度的体现了形势场的全局特征,既描述了其概率统计特征,也体现了其空间分布信息。
66.使用方向梯度直方图提取形势场的局部梯度信息描述符,将其作为形势场的局部特征。
67.在实际操作中,将形势场数据划分为小的元胞,将同一元胞中所有梯度方向相同的格点累加计数,计算出该元胞的一维方向梯度直方图,为了保证一定的平移不变性,需要将元胞组成更大的块并归一化块内的所有元胞。得到的块描述符就叫做hog描述子,再将所有块的hog描述子串联起来作为形势场的特征向量。形势场矩阵的每个格点水平和竖直方向的梯度都可以通过卷积核计算得出:首先用[-1,0,1]梯度算子对形势场做卷积运算,得到水平方向的梯度分量i
x
;再用[1,0,-1]
t
梯度算子对形势场做卷积运算,得到竖直方向的梯度分量iy;最后利用公式(1)与公式(2)计算该格点的梯度幅值和方向。
[0068][0069][0070]
形势场等值线相似检索
[0071]
提取了形势场中的等值线的坐标值和属性值,提取出的等值线如图5所示。
[0072]
参考等值线数值相似检索,如果两条“值”相似的等值线hj与hi不完全重合,两者总体上的差异就可以量化公式(3)中的h
ij
,h
ij
越小,表明两条等值线的“形”越接近。
[0073][0074]
使用lle流行学习算法对历史场与预报场进行降维,运用lle将高维数据样本x=[x1,x2,...,xm]∈rn×m映射为低维数据y=[y1,y2,...,yn]∈rd×m的具体步骤为:
[0075]
step 1:用k近邻算法得到每个点的一组邻域点,构建邻域图。
[0076]
step 2:由局部线性假设,样本点xi可用k个邻域点xj线性表示出来,即公式(4),其中w
i,j
为xi与xj之间的权重。
[0077]
xi≈∑w
i,j
xjꢀꢀ
(4)
[0078]
样本点xi与用其邻域点xj重构出的误差为公式(5),使ξ(w)最小的w
i,j
即为各样本点最优的线性表示参数,即权重。
[0079]
ξ(w)=∑i|x
i-∑jw
i,j
xj|2,∑w
i,j
=1
ꢀꢀ
(5)
[0080]
step 3:通过最小化误差将局部线性结构嵌入低维空间。嵌入操作是在低维空间里仍然满足(6)这里的w
i,j
是第二步计算的权值,通过最小化误差ξ(y)来尽可能多的保留原空间的性质。
[0081][0082]
公式(6)可进一步求解:
[0083]
ξ(y)=tr(ymy
t
)
ꢀꢀ
(7)
[0084]
式中m=(i-w)(i-w)
t
,w是w
i,j
构成的权值矩阵,因此y就是m的特征向量构成的矩阵。
[0085]
流形学习是使用数据之间的关系降维的,所以需要将预报场与历史场一同降维,使用lle算法提取各要素场的特征结构,不仅可以保持样本间的关系,也可以放大不同样本间的差异,从而当使用相似离度作为指标对数据进行重排列时,可以提高准确率。
[0086]
提取出的形势场的特征都以向量形式存储和运算的,比如特征x=(x1,x2,...,xn)与特征y=(y1,y2,...,yn),那么用皮尔逊相关系数衡量他们之间的差异。
[0087][0088]
在检索过程中需要综合考虑多个特征,包括:分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征,因此得到了各个特征的相似距离后,使用公式(9)计算预报形势场样本u与历史形势场样本v的各特征相似距离的加权和,即两个样本之间的相似程度。
[0089]
f(u,v)=w1r1+w2r2+w3r3+w4r4ꢀꢀ
(9)
[0090]
其中r为根据各个特征求得的相似距离,w为r对应的权重,并规定w的取值满足公
式(10)。
[0091]
w1+w2+w3+w4=1
ꢀꢀ
(10)
[0092]
根据辽宁省62个站点的6小时降雨量、温度、能见度、风速等实况数据对系统的多级降水预报能力和综合灾害预警能力进行评估。提出的方法对降水的预报效果总体优于相似离度,并且克服了空报、漏报偏多的现象,定量的说明了本算法的优势,此外,随着降雨量的增加,使用特征组合方法试预报准确率总体呈下降趋势。提出的方法对灾害天气的预报结果明显优于广泛使用的相似离度方法,对高温和强降水有较好的预报效果和预警能力。相对于相似离度,特征组合方法的检索时间更短,对特征进行检索时检索时间会成倍减少。

技术特征:
1.一种基于图像特征组合的降水相似预报方法,其特征在于,按以下步骤执行:步骤1:获取历史形势场数据:具体为海平面气压和500、700、850hpa标准等压面的基本量,包括位势高度、温度、纬向风速、经向风速、气压和比湿资料,以及相对应的历史实况数据,包括每个站点的降水量、能见度、风向风速的历史实况数据;步骤2:获取数值预报资料中的实时预报场资料,具体为未来某时刻的预报形势场数据;步骤3:选取相似时间与相似区域;对于相似时间的选取,根据预报形势场的日期,选取历史上每一年同期的前后15天的时间作为查找范围;对于相似区域的选取,以研究区域为核心、增加上游系统的相似范围,在进行形势场逐步过滤筛选时,分步进行大、中、小尺度的筛选;其中大尺度为经度25
°
、纬度20
°
跨度的长方形,中尺度为经度16
°
、纬度13
°
跨度的长方形,小尺度为经度8
°
、纬度6
°
跨度的长方形;建立逐层过滤的相似预报流程计算相似程度,对大尺度高度场进行相似过滤,反映环流形势的相似程度;对中尺度高度场进行相似过滤,表征天气影响系统的相似程度;对小尺度的高度场、温度场进行相似过滤,反映关键区物理量的相似程度;步骤4:提取历史形势场的多种特征,建立历史特征数据库;步骤5:提取出预报形势场的各个特征,求出预报形势场的每个特征与历史特征数据库中对应的历史形势场特征之间的皮尔逊相关系数,将其作为子特征的相似距离;将每个子特征相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度,即将所有特征相结合,使多个特征共同决定检索结果;逐层过滤的过程中,每一层都使用形势场多个特征的相似距离的加权和衡量形势场之间的相似程度;步骤6:根据求得的两个样本之间的相似程度,在历史形势场场数据中寻找与预报形势场数据最相似的10个个例,算出此10个个例对应时刻的实况数据中的降水量的加权和,将其作为当前时刻的多站点降水定量预报的结论。2.根据权利要求1所述的基于图像特征组合的降水相似预报方法,其特征在于:所述步骤4中提取形势场的多种特征,包括分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征。3.根据权利要求2所述的基于图像特征组合的降水相似预报方法,其特征在于:采用分块直方图提取形势场的特征,描述不同数值在整个形势场矩阵中所处的位置与所占的比重,将其作为形势场的全局特征,过程如下:将形势场形成的天气图等面积划分为4
×
4的矩形区域,分块后采用累加直方图方法计算每一个分块的直方图,并将其串联到一起,得到一个特征向量,针对矩形区域中不同位置的信息的重要程度,调整各分块的权值大小,并保证所有权值之和为1。4.根据权利要求2所述的基于图像特征组合的降水相似预报方法,其特征在于:采用方向梯度直方图的方法提取形势场的特征,使用方向梯度直方图提取形势场的局部梯度信息描述符,将其作为形势场的局部特征,过程如下:将形势场数据划分为小的元胞,将同一元胞中所有梯度方向相同的格点累加计数,计算出该元胞的一维方向梯度直方图,将元胞组成块并归一化块内的所有元胞,再将所有块的hog描述子串联起来作为形势场的特征向量。
5.根据权利要求2所述的基于图像特征组合的降水相似预报方法,其特征在于:使用lle流形学习算法提取形势场的非线性降维特征,将高维形势场数据样本映射为低维数据。6.根据权利要求1所述的基于图像特征组合的降水相似预报方法,其特征在于,所述步骤5中,提取出各个子特征后,计算预报形势场与历史形势场对应子特征之间的相似距离,再将每个子特征相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度。7.根据权利要求6所述的基于图像特征组合的降水相似预报方法,其特征在于:将各个子特征的相似距离的加权和作为预报形势场样本与历史形势场样本之间的相似程度,过程如下:针对提取出的分块直方图、方向梯度直方图、形势场等值线的特征、使用流形学习提取的非线性降维特征计算预报形势场与历史形势场对应特征之间的皮尔逊相关系数,将其作为子特征的相似距离;得到各个特征的相似距离后,再使用公式(9)计算预报形势场样本u与历史形势场样本v的各个子特征相似距离的加权和,将其作为两个样本之间的相似程度,即将所有特征相结合,使多个特征共同决定检索结果;f(u,v)=w1r1+w2r2+w3r3+w4r4ꢀꢀꢀꢀ
(9)其中r1为根据分块直方图求得的相似距离,r2为根据方向梯度直方图求得的相似距离,r3为根据形势场等值线的特征求得的相似距离,r4为根据使用流形学习提取的非线性降维特征求得的相似距离,w1为r1对应的权重,w2为r2对应的权重,w3为r3对应的权重,w4为r4对应的权重并规定w的取值满足公式(10)w1+w2+w3+w4=1
ꢀꢀꢀꢀ
(10)。

技术总结
本发明涉及图像检索技术领域,具体涉及一种基于图像特征组合的天气形势场降水相似预报方法,通过提取形势场的整体特征、局部特征、等值线的特征、非线性降维特征,针对提取出的特征做相似性度量,使多个特征共同决定检索结果,实现基于形势场的降水相似预报,提升了最终结果的准确率。此外,将历史形势场的低维特征提取出之后存入历史特征数据库,在计算相似度时直接对低维的特征做相似度量,提高了检索速度。本发明可以用于气象领域中降水量的分析问题。问题。问题。


技术研发人员:段勇 闫旭 于霞
受保护的技术使用者:沈阳工业大学
技术研发日:2022.02.17
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-5785.html

最新回复(0)