1.本公开涉及计算机技术领域,具体而言,涉及一种图像检测方法、装置、计算机设备及存储介质。
背景技术:2.在对图像进行处理时,如关键点检测、图像识别等,通常需要获取图像的语义信息,然后再基于图像的语义信息对图像进行后续处理,因此语义信息的准确性直接影响到后续的处理结果。因此,如何准确提取图像的语义信息成为亟待解决的技术问题。
技术实现要素:3.本公开实施例至少提供一种图像检测方法、装置、计算机设备及存储介质。
4.第一方面,本公开实施例提供了一种图像检测方法,包括:
5.获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;
6.将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次融合处理后得到所述初始语义特征图对应的一个目标融合特征图;
7.基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。
8.上述方法中,可以在确定待检测图像的初始语义特征图之后,将所述初始语义特征图中的多个标记特征进行至少一次融合处理,得到所述初始语义特征图对应的至少一个目标融合特征图,由此可以在保留特征信息的同时减少标记特征的数量;然后基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图。
9.由于标记特征能够表征所述初始语义特征图中的语义信息,在将所述初始语义特征图中的多个标记特征进行至少一次融合处理时,可以结合所述初始语义特征图中的语义信息,自适应地将同一语义信息的标记特征进行融合,待检测图像中的重要区域可以包含精细化划分的语义信息,因此可以使得所述待检测图像中的重要区域可以通过较多的标记特征来表达,进而提高所述待检测图像的语义表达的精度。
10.另外,通过结合所述初始语义特征图中的语义信息,将所述初始语义特征图中的多个标记特征进行至少一次融合处理,可以有针对性的调整各标记特征的特征范围,从而可以使用更精细化标记特征来表征细小区域,提高待检测图像在细节上的语义表达。
11.在一种可能的实施方式中,所述确定所述待检测图像的初始语义特征图,包括:
12.对所述待检测图像进行初步特征提取,得到所述待检测图像对应的初始特征图;
13.对所述初始特征图进行语义特征提取,得到所述初始语义特征图。
14.在一种可能的实施方式中,所述标记特征由所述初始语义特征图中的至少一个特征点的语义特征构成;
15.其中,不同标记特征所包含的特征点的语义特征的个数相同。
16.采用这种方法,可以将初始语义特征图的语义特征转化为多个标记特征进行表示,由此可以保证初始语义特征图中包含足够丰富的图像特征信息,进一步可以提取到更为全面的图像语义信息。
17.在一种可能的实施方式中,所述一次融合处理包括::
18.基于前一次融合处理的目标融合特征图中多个标记特征之间的特征相似度,对所述目标融合特征图中的多个标记特征进行聚类,将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征;
19.将各类簇对应的标记特征和所述目标融合特征图进行特征融合,确定中间融合特征图;
20.对所述中间融合特征图进行深层语义特征提取,得到当前次融合处理的目标融合特征图;
21.其中,首次融合处理中的目标融合特征图为所述初始语义特征图。
22.采用这种方法,可以将特征相似度高的标记特征划分为同一类簇,并对属于同一类簇的标记特征进行特征融合,减少了后续处理时的计算量。
23.在一种可能的实施方式中,所述方法通过预先训练的语义检测网络进行处理;
24.所述将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征,包括:
25.确定各标记特征对应的权重;所述权重为所述语义检测网络训练过程中调整的参数;
26.基于属于同一类簇的多个标记特征的特征值和各标记特征对应的权重,确定该类簇对应的融合后的标记特征的特征值。
27.采用这种方法,可以强化重要的标记特征的比重,弱化其他标记特征的比重,使得该类簇对应的融合后的标记特征的特征值能够保留更多的重要的标记特征的语义信息。
28.在一种可能的实施方式中,在所述目标融合特征图的个数为m的情况下,基于所述初始语义特征图和m个所述目标融合特征图,确定所述待检测图像对应的语义特征图,包括:
29.将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图,其中,在n+1=m时,第n个目标融合特征图对应的第一特征图为所述第n个目标融合特征图,n和m为正整数;
30.将所述第n+1个目标融合特征图对应的第二特征图与经过全连接处理后的第n个目标融合特征图进行融合处理及语义特征提取处理,得到第n个目标融合特征图对应的第一特征图;其中,在n=1时,所述第n个目标融合特征图为所述初始语义特征图;
31.基于得到的所述初始语义特征图对应的第一特征图确定所述待检测图像对应的语义特征图。
32.采用这种方法,可以将所述初始语义特征图还原成所述待检测图像的大小,并且在还原过程中,融合了至少一个目标融合特征图的语义信息,可以保留更多的语义信息,使得最终得到的语义特征图的语义信息更加全面且准确。
33.在一种可能的实施方式中,所述将第n+1个目标融合特征图对应的第一特征图中
的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图,包括:
34.根据进行融合处理得到所述第n+1个目标融合特征图过程中的聚类结果,将所述第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图。
35.采用这种方法,可以准确地确定所述第一特征图中的各标记特征在所述第二特征图中的对应位置,从而使最终得到的语义特征图的各标记特征的语义信息更加准确。
36.在一种可能的实施方式中,在确定所述待检测图像对应的语义特征图之后,所述方法还包括:
37.基于所述待检测图像对应的语义特征图,确定所述待检测图像的关键点的位置信息。
38.第二方面,本公开实施例还提供一种图像检测装置,包括:
39.获取模块,用于获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;
40.融合模块,用于将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次融合处理后得到所述初始语义特征图对应的一个目标融合特征图;
41.确定模块,用于基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。
42.在一种可能的实施方式中,所述获取模块,在确定所述待检测图像的初始语义特征图时,用于:
43.对所述待检测图像进行初步特征提取,得到所述待检测图像对应的初始特征图;
44.对所述初始特征图进行语义特征提取,得到所述初始语义特征图。
45.在一种可能的实施方式中,所述标记特征由所述初始语义特征图中的至少一个特征点的语义特征构成;
46.其中,不同标记特征所包含的特征点的语义特征的个数相同。
47.在一种可能的实施方式中,所述融合模块,在进行一次融合处理时,用于:
48.基于前一次融合处理的目标融合特征图中多个标记特征之间的特征相似度,对所述目标融合特征图中的多个标记特征进行聚类,将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征;
49.将各类簇对应的标记特征和所述目标融合特征图进行特征融合,确定中间融合特征图;
50.对所述中间融合特征图进行深层语义特征提取,得到当前次融合处理的目标融合特征图;
51.其中,首次融合处理中的目标融合特征图为所述初始语义特征图。
52.在一种可能的实施方式中,所述方法通过预先训练的语义检测网络进行处理;
53.所述融合模块,在将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征时,用于:
54.确定各标记特征对应的权重;所述权重为所述语义检测网络训练过程中调整的参
数;
55.基于属于同一类簇的多个标记特征的特征值和各标记特征对应的权重,确定该类簇对应的融合后的标记特征的特征值。
56.在一种可能的实施方式中,所述确定模块,在所述目标融合特征图的个数为m的情况下,在基于所述初始语义特征图和m个所述目标融合特征图,确定所述待检测图像对应的语义特征图时,用于:
57.将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图,其中,在n+1=m时,第n个目标融合特征图对应的第一特征图为所述第n个目标融合特征图,n和m为正整数;
58.将所述第n+1个目标融合特征图对应的第二特征图与经过全连接处理后的第n个目标融合特征图进行融合处理及语义特征提取处理,得到第n个目标融合特征图对应的第一特征图;其中,在n=1时,所述第n个目标融合特征图为所述初始语义特征图;
59.基于得到的所述初始语义特征图对应的第一特征图确定所述待检测图像对应的语义特征图。
60.在一种可能的实施方式中,所述确定模块,在将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图时,用于:
61.根据进行融合处理得到所述第n+1个目标融合特征图过程中的聚类结果,将所述第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图。
62.在一种可能的实施方式中,在确定所述待检测图像对应的语义特征图之后,所述确定模块,还用于:
63.基于所述待检测图像对应的语义特征图,确定所述待检测图像的关键点的位置信息。
64.第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
65.第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。
66.关于上述图像检测装置、计算机设备、及计算机可读存储介质的效果描述参见上述图像检测方法的说明,这里不再赘述。
67.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,而非限制本公开的技术方案。
68.为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
69.此处的附图被并入说明书中并构成本说明书的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。
70.为了更清楚地说明本公开实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,此处的附图被并入说明书中并构成本说明书中的一部分,这些附图示出了符合本公开的实施例,并与说明书一起用于说明本公开的技术方案。应当理解,以下附图仅示出了本公开的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
71.图1示出了本公开实施例所提供的一种图像检测方法的流程图;
72.图2a示出了本公开实施例所提供的一种确定初始语义特征图的示意图;
73.图2b示出了本公开实施例所提供的一种语义提取模块的示意图;
74.图3示出了本公开实施例所提供的一种划分后的初始特征图的示意图;
75.图4示出了本公开实施例所提供的图像检测方法中,一种融合处理具体方法的流程图;
76.图5a示出了本公开实施例所提供的一种融合处理过程的示意图;
77.图5b示出了本公开实施例所提供的一种ctm的内部结构的示意图;
78.图6示出了本公开实施例所提供的所提供的图像检测方法中,一种确定待检测图像对应的语义特征图的具体方法的流程图;
79.图7a示出了本公开实施例所提供的一种确定标记特征的融合位置和融合数量的示意图;
80.图7b示出了本公开实施例所提供的一种标记特征复制的示意图;
81.图8示出了本公开实施例所提供的一种确定初始语义特征图对应的第一特征图的过程的示意图;
82.图9示出了本公开实施例所提供的另一种图像检测方法的流程图;
83.图10示出了本公开实施例所提供的一种图像检测装置的架构示意图;
84.图11示出了本公开实施例所提供的一种计算机设备的结构示意图。
具体实施方式
85.为使本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例中附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本公开实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本公开的实施例的详细描述并非旨在限制要求保护的本公开的范围,而是仅仅表示本公开的选定实施例。基于本公开的实施例,本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。
86.人体检测和分析任务是计算机视觉领域以及智能视频监控领域的重要技术手段(如人体关键点检测、人脸关键点检测、三维人体重建等),同时也在行为识别、虚拟现实、增强现实等众多领域中有着重要的应用。
87.在人体检测和分析任务中,在对图像进行处理时,通常需要获取图像的语义信息,
然后基于图像的语义信息对图像进行后续处理。变换器(transformer)作为新兴的神经网络结构,被广泛应用在这一领域中。
88.transformer网络一般先将图片划分为形状大小相同的多个网格区域,并将每个网格区域用视觉标识符(vision token)来表示,再利用vision token进行图像特征的抽取。
89.然而通过这种方法若想获取更为精确的语义信息,则网格区域需要足够小,由此可能会造成数据量较大,而若想提高计算速度,则需要划分较大的网格区域,较大的网格区域中所包含的语义信息可能有多种,例如一个网格中可能即包含人物身体部分也包含背景部分,很难体现出人物身体部分与背景部分的区别,或者人体不同身体部位之间的区别,由此得到的语义信息精度较低。
90.基于上述研究,本公开提供了一种图像检测方法、装置、计算机设备及存储介质,可以在确定待检测图像的初始语义特征图之后,将所述初始语义特征图中的多个标记特征进行至少一次融合处理,得到所述初始语义特征图对应的至少一个目标融合特征图,由此可以在保留特征信息的同时减少标记特征的数量;然后基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图。
91.由于标记特征能够表征所述初始语义特征图中的语义信息,在将所述初始语义特征图中的多个标记特征进行至少一次融合处理时,可以结合所述初始语义特征图中的语义信息,自适应地将同一语义信息的标记特征进行融合,待检测图像中的重要区域可以包含精细化划分的语义信息,因此可以使得所述待检测图像中的重要区域可以通过较多的标记特征来表达,进而提高所述待检测图像的语义表达的精度。
92.另外,通过结合所述初始语义特征图中的语义信息,将所述初始语义特征图中的多个标记特征进行至少一次融合处理,可以有针对性的调整各标记特征的特征范围,从而可以使用更精细化标记特征来表征细小区域,提高待检测图像在细节上的语义表达。
93.应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。
94.本文中术语“和/或”,仅仅是描述一种关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括a、b、c中的至少一种,可以表示包括从a、b和c构成的集合中选择的任意一个或多个元素。
95.为便于对本实施例进行理解,首先对本公开实施例所公开的一种图像检测方法进行详细介绍,本公开实施例所提供的图像检测方法的执行主体一般为具有一定计算能力的计算机设备,该计算机设备例如包括:终端设备或服务器或其它处理设备,所述终端设备例如可以包括个人计算机等。在一些可能的实现方式中,该图像检测方法可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。
96.参见图1所示,为本公开实施例提供的图像检测方法的流程图,所述方法包括步骤101~步骤103,其中:
97.步骤101、获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;
98.步骤102、将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次
融合处理后得到所述初始语义特征图对应的一个目标融合特征图;
99.步骤103、基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。
100.以下是针对上述步骤的详细说明:
101.针对步骤101、
102.在一种可能的实施方式中,如图2a所示,在确定所述待检测图像的初始语义特征图时,可以先对所述待检测图像进行初步特征提取,得到所述待检测图像对应的初始特征图,然后对所述初始特征图进行语义特征提取,得到所述初始语义特征图。
103.在一些实施例中,所述图像检测方法可以通过预先训练的语义检测网络进行处理,在对所述待检测图像进行初步特征提取时,可以将所述待检测图像输入至所述语义检测网络的初步特征提取模块中,得到所述待检测图像对应的初始特征图,所述初始特征图包含所述待检测图像的浅层特征;然后为了提取出所述待检测图像的语义特征,再将所述初始特征图输入至所述语义检测网络的语义提取模块中,所述语义提取模块的可以是由多个转换模块(transformer block)组成的,示例性的所述语义提取模块的结构可以如图2b所示。
104.所述标记特征(token),可以理解为所述初始语义特征图中的部分特征,所述多个标记特征构成所述初始语义特征图,因此所述标记特征可以用来表征所述待检测图像的部分语义信息。比如,所述初始语义特征图为一h*w*c的特征图,h和w表示特征图的长和宽,c表示特征图的通道数,所述标记特征可以理解为构成所述初始语义特征图的特征向量,例如可以是1*1*c维的特征向量。
105.在一种可能的实施方式中,所述标记特征由所述初始语义特征图中的至少一个特征点的语义特征构成;其中,不同标记特征所包含的特征点的语义特征的个数相同。
106.示例性的,所述标记特征可以由所述初始语义特征图中的一个特征点的语义特征构成,即所述初始语义特征图中的每个特征点均对应一个标记特征,特征点的特征值即为该特征点对应的标记特征的取值。
107.或者,又一示例中,所述标记特征可以由所述初始语义特征图中的多个特征点的语义特征构成。在确定所述标记特征时,可以是将所述多个特征点划分至多个区域,然后基于所述多个区域的特征点的语义特征生成多个标记特征,具体的可以包括以下步骤:
108.步骤a1、在得到所述待检测图像对应的初始特征图之后,可以按照预设尺寸对所述初始特征图进行划分,确定所述初始特征图中的多个区域;
109.具体的,在按照预设尺寸对所述初始特征图进行划分时,可以是按照预设的长和宽将所述初始特征图均等划分为多个区域,如每个区域的长为3个像素,宽为2个像素,或者可以是按照预设的区域数量如m
×
n将所述初始特征图划分为多个区域,所述m和n均为大于等于1的整数。划分后的初始特征图示例性的可以如图3所示。
110.这里,在将所述初始特征图划分成所述多个区域后,记录了所述多个区域分别在所述初始特征图中的位置信息。
111.步骤a2、在对所述初始特征图进行语义特征提取之后,任一区域中包含的所有特征点在所述初始语义特征图中对应的语义特征构成一个标记特征。
112.在一些实施例中,可以基于所述多个区域分别在所述初始特征图中的位置信息,确定所述多个区域分别在所述初始语义特征图中的位置,然后基于所述多个区域分别在所述初始语义特征图中的位置,确定所述多个区域分别在所述初始语义特征图中的语义特征,最后将所述多个区域分别对应的语义特征提取出来作为所述标记特征。
113.采用这种方法,可以将初始语义特征图的语义特征转化为多个标记特征进行表示,由此可以保证初始语义特征图中包含足够丰富的图像特征信息,进一步可以提取到更为全面的图像语义信息。
114.一种可能的实施方式中,在对所述待检测图像进行初步特征提取,得到所述待检测图像对应的初始特征图之后,可以先对所述初始特征图按照如上方法进行划分,划分为多个token,然后再进行语义特征提取,得到包含多个标记特征的初始语义特征图。
115.或者,在另外一种可能的实施方式中,在对所述待检测图像进行初步特征提取,得到所述待检测图像对应的初始特征图之后,可以先对所述初始特征图进行语义特征提取,得到所述初始语义特征图,然后再对所述初始语义特征图按照如上方法进行划分,得到包含多个标记特征的初始语义特征图。
116.针对步骤102、
117.在一种可能的实施方式中,可以根据如图4所示的方法进行一次融合处理,具体包括以下几个步骤:
118.步骤401、基于前一次融合处理的目标融合特征图中多个标记特征之间的特征相似度,对所述前一次融合处理的目标融合特征图中的多个标记特征进行聚类;其中,首次融合处理的目标融合特征图为所述初始语义特征图。
119.其中,在基于前一次融合处理的目标融合特征图中多个标记特征之间的特征相似度,对所述前一次融合处理的目标融合特征图中的多个标记特征进行聚类时,可以先从前一次融合处理的目标融合特征图的多个标记特征中确定聚类中心特征,然后基于其他标记特征与聚类中心特征之间的特征相似度,将其他标记特征划分至不同的聚类中心特征所在的类簇中。
120.具体的,所述聚类过程可以包括以下步骤:
121.步骤b1、针对任一标记特征(以下称为标记特征xi),确定与标记特征xi之间的特征距离最近的k个邻近标记特征,其中,k为大于等于1的整数,如5。
122.示例性的,可以通过k最邻近分类算法(k-nearest neighbor,knn)计算标记特征xi与其他标记特征之间的特征距离,将所述特征距离按照大小进行排序,将最小的k个特征距离对应的其他标记特征作为所述邻近标记特征。
123.这里,需要说明的是,与标记特征xi的特征距离最近的k个其他标记特征并不一定是与标记特征xi相邻的标记特征。
124.步骤b2、基于标记特征xi和所述邻近标记特征,确定标记特征xi的局部密度。示例性的,可以采用以下公式进行计算:
125.126.其中,ρi表示第i个标记特征的局部密度,k为所述邻近标记特征的个数,xi表示第i个标记特征,xj表示标记特征xi对应的邻近标记特征,knn(xi)表示标记特征xi对应的邻近标记特征的集合。
127.步骤b3、从所述邻近标记特征中确定比标记特征xi的局部密度高的候选标记特征,从所述候选标记特征中确定与标记特征xi特征距离最近的目标标记特征,将所述目标标记特征与标记特征xi之间的特征距离作为目标距离。
128.候选标记特征的局部密度高于标记特征xi的局部密度,则所述候选标记特征比所述标记特征xi更有可能成为聚类中心特征,而聚类中心特征与标记特征xi可能会成为同一类簇,聚类中心特征应该与标记特征xi特征相近,因此在确定聚类中心特征时,结合了所述候选标记特征中与标记特征xi特征距离。
129.这里,当标记特征xi的局部密度为最大的情况下,从所述邻近标记特征中确定与标记特征xi之间特征距离最大的最远标记特征,并将标记特征xi与所述最远标记特征之间的特征距离作为所述目标距离。
130.步骤b4、针对各标记特征,在通过以上方法求出所述各标记特征的局部密度和目标距离之后,将所述各标记特征的局部密度与目标距离相乘,得到所述各标记特征的聚类分数,将所述各聚类分数按照分数高低进行排序,将所述聚类分数最高的预设个数的标记特征作为聚类中心特征。
131.步骤b5、将除所述聚类中心特征以外的标记特征,划分至与所述聚类中心特征之间的特征距离最近的聚类中心特征,从而得到多个类簇。
132.具体的,针对除所述聚类中心特征以外的任一标记特征,可以计算该标记特征与各聚类中心特征之间的特征距离,然后确定该标记特征所属的类簇。
133.步骤402、将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征。
134.在一种可能的实施方式中,在将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征时,可以将属于同一类簇的多个标记特征的特征值的均值,作为该类簇对应的融合后的标记特征的特征值。
135.具体的,可以将同一类簇的标记特征的特征值相加,除以该类簇中标记特征的个数,得到该类簇中的标记特征的特征值的均值,并将该均值作为该类簇对应的融合后的标记特征的特征值。
136.进一步地,在一种可能的实施方式中,所述方法可以通过预先训练的语义检测网络执行;在将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征时,可以确定各标记特征对应的权重;所述权重为所述语义检测网络训练过程中调整的参数;然后基于属于同一类簇的多个标记特征的特征值和各标记特征对应的权重,确定该类簇对应的融合后的标记特征的特征值。
137.示例性的,在确定融合后的标记特征的特征值时,可以通过以下公式进行计算:
[0138][0139]
其中,yi表示融合后的标记特征的特征值,i表示类簇的编号,ci表示第i个类簇中所有标记特征的编号的集合,j表示第i个类簇中标记特征的编号,xj表示第i个类簇中第j个标记特征,p表示标记特征xj的权重。
[0140]
采用这种方法,可以强化重要的标记特征的比重,弱化其他标记特征的比重,使得该类簇对应的融合后的标记特征的特征值能够保留更多的重要的标记特征的语义信息。
[0141]
步骤403、将各类簇对应的标记特征和所述前一次融合处理的目标融合特征图进行特征融合,确定中间融合特征图。
[0142]
在将属于同一类簇的多个标记特征进行特征融合,确定各类簇对应的标记特征之后,为了防止丢失细节信息,因此可以将各类簇对应的标记特征与前一次融合处理的目标融合特征图进行特征融合。
[0143]
示例性的,在将各类簇对应的标记特征和所述前一次融合处理的目标融合特征图进行特征融合是,可以将各类簇对应的标记特征和所述前一次融合处理的目标融合特征图输入至transformer block中,所述transformer block可以输入所述中间融合特征图。
[0144]
具体的,所述transformer block可以从所述前一次融合处理的目标融合特征图中提取出各标记特征的关键特征信息,计算所述关键特征信息与对应位置处的融合后的标记特征之间的特征相似度,将所述前一次融合处理的目标融合特征图中的各标记特征的特征值与对应的特征相似度相乘后,与各类簇对应的标记特征相加,得到所述中间融合特征图。
[0145]
示例性的,可以通过如下公式进行计算:
[0146][0147]
其中,attention(q,k,v)表示该标记特征的特征值与对应的特征相似度相乘得到的结果,q表示融合后的标记特征的特征值,k表示所述关键特征信息,v表示该标记特征的特征值,dk表示融合后的标记特征的特征通道数目。
[0148]
或者,在一种可能的实施方式中,在计算所述关键特征信息与对应位置处的融合后的标记特征之间的特征相似度之后,可以结合前一次融合处理的目标融合特征图的权重计算所述中间融合特征图。
[0149]
示例性的,针对前一次融合处理的目标融合特征图中的任一标记特征,可以采用如下公式进行计算:
[0150][0151]
其中,attention(q,k,v)表示该标记特征的特征值与对应的特征相似度相乘得到的结果,q表示融合后的标记特征的特征值,k表示所述关键特征信息,v表示该标记特征的特征值,dk表示融合后的标记特征的特征通道数目,p表示该标记特征的权重。
[0152]
步骤404、对所述中间融合特征图进行深层语义特征提取,得到当前次融合处理的目标融合特征图。
[0153]
具体的,在对所述中间融合特征图进行深层语义特征提取时,可以将所述中间融合特征图输入至语义提取模块,并由所述语义提取模块可以输出所述目标融合特征图,所述目标融合特征图经所述深层语义特征提取生成更多特征通道,以得到更深层次的语义信息。
[0154]
综上所述,按照上述步骤401~步骤404执行至少一次融合处理,后一次融合处理是在前一次融合处理的基础上执行的。示例性的,在进行了三次融合处理的情况下,该融合处理过程可以如图5a所示,语义提取模块用于执行步骤404进行语义特征提取,通过聚合的标记特征融合模块(clustering-based token merge module,ctm)进行标记特征的聚类和融合,即执行步骤401~步骤403,所述ctm的内部结构如图5b所示。
[0155]
采用步骤401~步骤404所述的方法,可以将特征相似度高的标记特征划分为同一类簇,并对属于同一类簇的标记特征进行特征融合,减少了后续处理时的计算量。
[0156]
针对步骤103、
[0157]
在一种可能的实施方式中,在所述目标融合特征图的个数为m的情况下,在基于所述初始语义特征图和m个所述目标融合特征图,确定所述待检测图像对应的语义特征图时,可以参照如图6所示的方法,具体如以下步骤:
[0158]
步骤601、将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图,其中,在n+1=m时,第n个目标融合特征图对应的第一特征图为所述第n个目标融合特征图,n和m为正整数。
[0159]
在一种可能的实施方式中,可以根据进行融合处理得到所述第n+1个目标融合特征图过程中的聚类结果,将所述第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图。
[0160]
其中,所述聚类结果可以包括融合成所述第n+1个目标融合特征图的融合标记特征的融合位置和融合数量,以及所述第n+1个目标融合特征图中的各标记特征的特征值。
[0161]
具体的,如图7a所示,针对所述第一特征图中的任一标记特征,可以确定该标记特征在所述第n个目标融合特征图中的融合位置和融合数量,所述融合位置为所述第n个目标融合特征图中融合成该标记特征的的融合标记特征的位置,所述融合数量为所述融合标记特征的数量,示例性的,如果所述第一特征图中的标记特征a是由第n个目标融合特征图中的标记特征1、标记特征2和标记特征3融合而成,则标记特征a在第n个目标融合特征图中的融合位置为标记特征1、标记特征2和标记特征3的位置,所述融合数量为3。
[0162]
如图7b所示,在确定所述融合位置和所述融合数量后,可以将该标记特征按照所
述融合数量进行复制,并将复制结果作为所述融合位置处的标记特征。延续上例,则是将所述标记特征a复制后作为标记特征1、标记特征2和标记特征3的位置处的标记特征,依次类推,确定所述第一特征图中的各标记特征的融合位置和融合数量,并进行复制从而构成所述第二特征图。
[0163]
采用这种方法,可以准确地确定所述第一特征图中的各标记特征在所述第二特征图中的对应位置,从而使最终得到的语义特征图的各标记特征的语义信息更加准确。
[0164]
步骤602、将所述第n+1个目标融合特征图对应的第二特征图与经过全连接处理后的第n个目标融合特征图进行融合处理及语义特征提取处理,得到第n个目标融合特征图对应的第一特征图;其中,在n=1时,所述第n个目标融合特征图为所述初始语义特征图;
[0165]
这里,由于在每一次融合处理的过程中经过了深层语义特征提取,因此不同的目标融合特征图的尺寸是不同的,而步骤601中进行上采样并不会改变目标融合特征图的尺寸,因此需要对第n个目标融合特征图进行全连接处理,以便于进行融合。
[0166]
具体的,在进行融合之前,为了使所述第n个目标融合特征图与所述第n+1个目标融合特征图对应的第二特征图的特征通道数目相同,可以先将所述第n个目标融合特征图输入至线性层进行全连接处理,变更所述第n个目标融合特征图的特征通道数目。
[0167]
示例性的,如果所述第n+1个目标融合特征图对应的第二特征图的特征通道数目为512,所述第n个目标融合特征图的特征通道数目为256,可以将所述第n个目标融合特征图进行全连接处理,将特征通道数目变更为512。
[0168]
然后,将所述第二特征图与所述第n个目标融合特征图的对应位置的标记特征的特征值分别相加,将相加后得到的中间特征图输入至transformer block中,得到所述第n个目标融合特征图对应的第一特征图。
[0169]
这里,每次进行语义特征提取时,采用的语义特征提取模块可以是由多层transformer block组成,不同的语义特征提取模块的transformer block的层数可以相同也可以不同。
[0170]
示例性的,以目标融合特征图的个数为4(包含初始语义特征图)为例,执行步骤601~步骤602确定所述初始语义特征图对应的第一特征图的过程可以如图8所示。
[0171]
采用步骤601~步骤602所述的方法,可以将所述初始语义特征图还原成所述待检测图像的大小,并且在还原过程中,融合了至少一个目标融合特征图的语义信息,可以保留更多的语义信息,使得最终得到的语义特征图的语义信息更加全面且准确。
[0172]
步骤603、基于得到的所述初始语义特征图对应的第一特征图确定所述待检测图像对应的语义特征图。
[0173]
在得到所述初始语义特征图对应的第一特征图之后,为了保证最终得到的语义特征图与所述待检测图像的尺寸保持一致,可以对所述初始语义特征图对应的第一特征图进行重塑reshape处理。
[0174]
下面将结合具体的附图,对上述图像检测方法进行描述,参见图9所示,为本公开实施例提供的一种图像检测方法的流程图,主要包括以下几个步骤:
[0175]
首先将待检测图像输入至初步特征提取模块(如卷积层)进行初步特征提取,得到初步特征图,然后将初步特征图输入到语义提取模块中,得到初始语义特征图;
[0176]
然后将初始语义特征图输入到所述ctm中,对初始语义特征图中的标记特征进行
聚类和融合,并将聚类后的特征图输入至语义提取模块中,得到一次融合处理后的目标融合特征图;
[0177]
再基于多次融合处理分别得到的目标融合特征图和所述初始语义特征图,确定所述待检测图像对应的语义特征图。
[0178]
具体的执行步骤请参照上述实施例的描述,在此将不再赘述。
[0179]
这里,所述语义特征图中所包含的语义类别与语义特征图的应用相关。示例性的,若所述语义特征图用于进行人脸关键点识别,则所述语义特征图中所包含的语义类别可以包含精细化划分的人脸部分的语义类别(如眼角、嘴角、鼻子、眼球等),而对于其余部分的语义信息,可以不做详细的区分,例如人体的其他部分可以统一为同一语义信息“躯干”。若所述语义特征图用于进行手势识别,则所述语义特征中所包含的语义类别可以包含精细化划分的手部部分的语义类别(如手指尖、手关节、手腕、手掌等),而对于其余部分的语义信息,可以区分为“头部”、“腿部”等。
[0180]
在一种可能的实施方式中,在确定所述待检测图像对应的语义特征图之后,可以基于所述待检测图像对应的语义特征图,确定所述待检测图像的关键点的位置信息。
[0181]
示例性的,若要对所述待检测图像进行人体关键点检测,则可以先基于上述方法得到所述待检测图像对应的语义特征图,然后基于所述语义特征图,确定所述待检测图像中的人体关键点的位置信息。
[0182]
具体的,可以将所述语义特征图输入至预先训练的关键点检测模型,所述关键点检测模型可以根据所述语义特征图的语义信息,确定所述语义特征图中的关键点,并将所述关键点进行分类,然后输出所述关键点的类别、所述关键点的位置信息、以及所述关键点属于该类别的置信度。
[0183]
同理,还可以基于上述方法进行人脸关键点检测、物体关键点检测、物体识别等。
[0184]
在确定所述关键点位置信息之后,进一步地,可以基于所述关键点的位置信息进行状态识别,如手部关键点信息可以进行手势识别、人脸关键点信息可以进行表情识别、人体关键点信息可以进行动作识别等,并且可以基于所述关键点的位置信息构建与所述目标对象对应的三维模型等。
[0185]
本公开实施例提供的图像检测方法,可以在确定待检测图像的初始语义特征图之后,将所述初始语义特征图中的多个标记特征进行至少一次融合处理,得到所述初始语义特征图对应的至少一个目标融合特征图,由此可以在保留特征信息的同时减少标记特征的数量;然后基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图。
[0186]
由于标记特征能够表征所述初始语义特征图中的语义信息,在将所述初始语义特征图中的多个标记特征进行至少一次融合处理时,可以结合所述初始语义特征图中的语义信息,自适应地将同一语义信息的标记特征进行融合,待检测图像中的重要区域可以包含精细化划分的语义信息,因此可以使得所述待检测图像中的重要区域可以通过较多的标记特征来表达,进而提高所述待检测图像的语义表达的精度。
[0187]
另外,通过结合所述初始语义特征图中的语义信息,将所述初始语义特征图中的多个标记特征进行至少一次融合处理,可以有针对性的调整各标记特征的特征范围,从而可以使用更精细化标记特征来表征细小区域,提高待检测图像在细节上的语义表达。
[0188]
本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的撰写顺序并不意味着严格的执行顺序而对实施过程构成任何限定,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
[0189]
基于同一发明构思,本公开实施例中还提供了与图像检测方法对应的图像检测装置,由于本公开实施例中的装置解决问题的原理与本公开实施例上述图像检测方法相似,因此装置的实施可以参见方法的实施,重复之处不再赘述。
[0190]
参照图10所示,为本公开实施例提供的一种图像检测装置的架构示意图,所述装置包括:获取模块1001、融合模块1002、确定模块1003;其中,
[0191]
获取模块1001,用于获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;
[0192]
融合模块1002,用于将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次融合处理后得到所述初始语义特征图对应的一个目标融合特征图;
[0193]
确定模块1003,用于基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。
[0194]
在一种可能的实施方式中,所述获取模块1001,在确定所述待检测图像的初始语义特征图时,用于:
[0195]
对所述待检测图像进行初步特征提取,得到所述待检测图像对应的初始特征图;
[0196]
对所述初始特征图进行语义特征提取,得到所述初始语义特征图。
[0197]
在一种可能的实施方式中,所述标记特征由所述初始语义特征图中的至少一个特征点的语义特征构成;
[0198]
其中,不同标记特征所包含的特征点的语义特征的个数相同。
[0199]
在一种可能的实施方式中,所述融合模块1002,在进行一次融合处理时,用于:
[0200]
基于前一次融合处理的目标融合特征图中多个标记特征之间的特征相似度,对所述目标融合特征图中的多个标记特征进行聚类,将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征;
[0201]
将各类簇对应的标记特征和所述目标融合特征图进行特征融合,确定中间融合特征图;
[0202]
对所述中间融合特征图进行深层语义特征提取,得到当前次融合处理的目标融合特征图;
[0203]
其中,首次融合处理中的目标融合特征图为所述初始语义特征图。
[0204]
在一种可能的实施方式中,所述方法通过预先训练的语义检测网络进行处理;
[0205]
所述融合模块1002,在将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征时,用于:
[0206]
确定各标记特征对应的权重;所述权重为所述语义检测网络训练过程中调整的参数;
[0207]
基于属于同一类簇的多个标记特征的特征值和各标记特征对应的权重,确定该类簇对应的融合后的标记特征的特征值。
[0208]
在一种可能的实施方式中,所述确定模块1003,在所述目标融合特征图的个数为m
的情况下,在基于所述初始语义特征图和m个所述目标融合特征图,确定所述待检测图像对应的语义特征图时,用于:
[0209]
将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图,其中,在n+1=m时,第n个目标融合特征图对应的第一特征图为所述第n个目标融合特征图,n和m为正整数;
[0210]
将所述第n+1个目标融合特征图对应的第二特征图与经过全连接处理后的第n个目标融合特征图进行融合处理及语义特征提取处理,得到第n个目标融合特征图对应的第一特征图;其中,在n=1时,所述第n个目标融合特征图为所述初始语义特征图;
[0211]
基于得到的所述初始语义特征图对应的第一特征图确定所述待检测图像对应的语义特征图。
[0212]
在一种可能的实施方式中,所述确定模块1003,在将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图时,用于:
[0213]
根据进行融合处理得到所述第n+1个目标融合特征图过程中的聚类结果,将所述第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图。
[0214]
在一种可能的实施方式中,在确定所述待检测图像对应的语义特征图之后,所述确定模块1003,还用于:
[0215]
基于所述待检测图像对应的语义特征图,确定所述待检测图像的关键点的位置信息。
[0216]
关于装置中的各模块的处理流程、以及各模块之间的交互流程的描述可以参照上述方法实施例中的相关说明,这里不再详述。
[0217]
基于同一技术构思,本公开实施例还提供了一种计算机设备。参照图11所示,为本公开实施例提供的计算机设备1100的结构示意图,包括处理器1101、存储器1102、和总线1103。其中,存储器1102用于存储执行指令,包括内存11021和外部存储器11022;这里的内存11021也称内存储器,用于暂时存放处理器1101中的运算数据,以及与硬盘等外部存储器11022交换的数据,处理器1101通过内存11021与外部存储器11022进行数据交换,当计算机设备1100运行时,处理器1101与存储器1102之间通过总线1103通信,使得处理器1101在执行以下指令:
[0218]
获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;
[0219]
将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次融合处理后得到所述初始语义特征图对应的一个目标融合特征图;
[0220]
基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。
[0221]
本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述方法实施例中所述的图像检测方法的步骤。其中,该存储介质可以是易失性或非易失的计算机可读取存储介质。
[0222]
本公开实施例还提供一种计算机程序产品,该计算机产品承载有程序代码,所述程序代码包括的指令可用于执行上述方法实施例中所述的图像检测方法的步骤,具体可参见上述方法实施例,在此不再赘述。
[0223]
其中,上述计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,所述计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
[0224]
所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统和装置的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。在本公开所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,又例如,多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些通信接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
[0225]
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0226]
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
[0227]
所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个处理器可执行的非易失的计算机可读取存储介质中。基于这样的理解,本公开的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本公开各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
[0228]
最后应说明的是:以上所述实施例,仅为本公开的具体实施方式,用以说明本公开的技术方案,而非对其限制,本公开的保护范围并不局限于此,尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:任何熟悉本技术领域的技术人员在本公开揭露的技术范围内,其依然可以对前述实施例所记载的技术方案进行修改或可轻易想到变化,或者对其中部分技术特征进行等同替换;而这些修改、变化或者替换,并不使相应技术方案的本质脱离本公开实施例技术方案的精神和范围,都应涵盖在本公开的保护范围之内。因此,本公开的保护范围应所述以权利要求的保护范围为准。
[0229]
若本技术技术方案涉及个人信息,应用本技术技术方案的产品在处理个人信息前,已明确告知个人信息处理规则,并取得个人自主同意。若本技术技术方案涉及敏感个人信息,应用本技术技术方案的产品在处理敏感个人信息前,已取得个人单独同意,并且同时
满足“明示同意”的要求。例如,在摄像头等个人信息采集装置处,设置明确显著的标识告知已进入个人信息采集范围,将会对个人信息进行采集,若个人自愿进入采集范围即视为同意对其个人信息进行采集;或者在个人信息处理的装置上,利用明显的标识/信息告知个人信息处理规则的情况下,通过弹窗信息或请个人自行上传其个人信息等方式获得个人授权;其中,个人信息处理规则可包括个人信息处理者、个人信息处理目的、处理方式以及处理的个人信息种类等信息。
技术特征:1.一种图像检测方法,其特征在于,包括:获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次融合处理后得到所述初始语义特征图对应的一个目标融合特征图;基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。2.根据权利要求1所述的方法,其特征在于,所述确定所述待检测图像的初始语义特征图,包括:对所述待检测图像进行初步特征提取,得到所述待检测图像对应的初始特征图;对所述初始特征图进行语义特征提取,得到所述初始语义特征图。3.根据权利要求1或2所述的方法,其特征在于,所述标记特征由所述初始语义特征图中的至少一个特征点的语义特征构成;其中,不同标记特征所包含的特征点的语义特征的个数相同。4.根据权利要求1~3任一所述的方法,其特征在于,所述一次融合处理包括:基于前一次融合处理的目标融合特征图中多个标记特征之间的特征相似度,对所述目标融合特征图中的多个标记特征进行聚类,将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征;将各类簇对应的标记特征和所述目标融合特征图进行特征融合,确定中间融合特征图;对所述中间融合特征图进行深层语义特征提取,得到当前次融合处理的目标融合特征图;其中,首次融合处理中的目标融合特征图为所述初始语义特征图。5.根据权利要求4所述的方法,其特征在于,所述方法通过预先训练的语义检测网络进行处理;所述将属于同一类簇的多个标记特征进行特征融合,确定该类簇对应的标记特征,包括:确定各标记特征对应的权重;所述权重为所述语义检测网络训练过程中调整的参数;基于属于同一类簇的多个标记特征的特征值和各标记特征对应的权重,确定该类簇对应的融合后的标记特征的特征值。6.根据权利要求4或5所述的方法,其特征在于,在所述目标融合特征图的个数为m的情况下,基于所述初始语义特征图和m个所述目标融合特征图,确定所述待检测图像对应的语义特征图,包括:将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图,其中,在n+1=m时,第n个目标融合特征图对应的第一特征图为所述第n个目标融合特征图,n和m为正整数;将所述第n+1个目标融合特征图对应的第二特征图与经过全连接处理后的第n个目标融合特征图进行融合处理及语义特征提取处理,得到第n个目标融合特征图对应的第一特征图;其中,在n=1时,所述第n个目标融合特征图为所述初始语义特征图;
基于得到的所述初始语义特征图对应的第一特征图确定所述待检测图像对应的语义特征图。7.根据权利要求6所述的方法,其特征在于,所述将第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图,包括:根据进行融合处理得到所述第n+1个目标融合特征图过程中的聚类结果,将所述第n+1个目标融合特征图对应的第一特征图中的各标记特征进行上采样处理,确定所述第n+1个目标融合特征图对应的第二特征图。8.根据权利要求1~7任一所述的方法,其特征在于,在确定所述待检测图像对应的语义特征图之后,所述方法还包括:基于所述待检测图像对应的语义特征图,确定所述待检测图像的关键点的位置信息。9.一种图像检测装置,其特征在于,包括:获取模块,用于获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;融合模块,用于将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次融合处理后得到所述初始语义特征图对应的一个目标融合特征图;确定模块,用于基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。10.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至8任一项所述的图像检测方法的步骤。11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8任一项所述的图像检测方法的步骤。
技术总结本公开提供了一种图像检测方法、装置、计算机设备及存储介质,其中,该方法包括:获取待检测图像,并确定所述待检测图像的初始语义特征图;其中,所述初始语义特征图中包含多个标记特征;将所述初始语义特征图中的多个标记特征进行至少一次融合处理,每次融合处理后得到所述初始语义特征图对应的一个目标融合特征图;基于所述初始语义特征图和至少一个所述目标融合特征图,确定所述待检测图像对应的语义特征图,其中,所述语义特征图用于确定所述待检测图像的各像素点的语义信息。检测图像的各像素点的语义信息。检测图像的各像素点的语义信息。
技术研发人员:曾望 金晟 刘文韬 钱晨 罗平 欧阳万里
受保护的技术使用者:商汤集团有限公司
技术研发日:2022.04.18
技术公布日:2022/7/4