logo的识别方法及装置、存储介质、电子设备
技术领域
1.本发明涉及深度学习技术领域,更具体地,涉及一种logo的识别方法及装置、存储介质、电子设备。
背景技术:2.目前,在logo识别方面最主流的解决方案是使用度量学习的策略,即对于同一个类别里的图像在经过同一个网络结构后,生成的表征相近,对于不属于同一个类别的图像让其生成的表征相远。在经过对于所有类别的表征学习后,对于每一类的logo图像选择部分图像生成检索库,检索库中存储相应图像的表征向量,在进行logo识别时,对于要识别的logo图像先经过网络结构生成对应的表征,接着在检索库中寻找与此图像表征最近的logo图,以最近的logo图的类别判定目前要识别的logo的类别。
3.现有技术中,在真实的应用场景下,很多时候的logo会出现被遮挡的问题,只有部分的logo图像信息可以被网络利用,又因为logo图像本来就较小,且logo本身所含信息较少,与其他logo的部分重合度较高,使得在对于部分露出的logo的识别存在很大的错误率。
4.针对相关技术中存在的上述问题,目前尚未发现有效的解决方案。
技术实现要素:5.为了解决现有技术的不足,本发明提供了一种logo的识别方法及装置、存储介质、电子设备。
6.根据本技术实施例的一个方面,提供了一种logo的识别方法,包括:获取样本logo图像的全局图像与局部图像;通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;将学习完成之后的第二模型输出为残缺logo识别模型。
7.进一步地,获取样本logo图像的全局图像与局部图像包括:对样本logo图像进行随机切割,截取获得m张相同尺寸的局部图像,其中,所述局部图像的尺寸小于所述样本logo图像的尺寸,m为大于1的正整数;对所述样本logo图像进行n次增强操作,得到n张全局图像,其中,所述全局图像的尺寸与所述样本logo图像的尺寸相同,n为大于1的正整数。
8.进一步地,对所述样本logo图像进行n次增强操作,得到n张全局图像包括:对所述样本logo图像进行第一增强操作,得到第一全局图像,所述第一增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强;对所述样本logo图像进行第二增强操作,得到第二全局图像,所述第二增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强,其中,所述n张全局图像包括所述第一全局图像和所述第二全局图像。
9.进一步地,在对所述第一模型和所述第二模型进行自监督学习之前,所述方法还包括:获取监督学习的样本数据,其中,所述样本数据包括样本图像数据和对应所述样本图像数据的分类标签数据;采用所述样本数据训练所述第一模型。
10.进一步地,所述样本图像数据为所述样本logo图像,获取监督学习的样本数据包括:解析所述样本logo图像,判断所述样本logo图像中是否包含标注数据信息;若所述样本logo图像中包含标注数据信息,将所述标注数据信息确定为所述样本图像数据的分类标签数据;若所述样本logo图像中不包含标注数据信息,接收输入的人工标签数据,将所述人工标签数据确定为所述样本图像数据的分类标签数据。
11.进一步地,所述第一特征向量包括多个第一子向量,所述第二特征向量包括多个第二子向量,对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量包括:针对每个所述第二子向量,分别计算与每个所述第一子向量之间的欧式空间距离;判断所述欧式空间距离是否大于预设约束值;若所述欧式空间距离大于预设约束值,执行以下步骤,直到所述第一特征向量中的任一第一子向量与所述第二特征向量中的任一第二子向量之间的欧式空间距离均小于或等于所述预设约束值:采用所述第二模型的损失函数更新所述第二模型的模型参数,并采用更换后的第二模型重新提取所述全局图像和所述局部图像的第二特征向量。
12.进一步地,在将学习完成之后的第二模型输出为残缺logo识别模型之后,所述方法还包括:接收待识别的目标logo图像,其中,所述目标logo图像为残缺的logo图像;采用所述残缺logo识别模型提取所述目标logo图像的目标特征向量;在图像库中检索与所述目标特征向量最匹配的logo图案;将所述logo图案输出为所述目标logo图像的识别结果。
13.根据本技术实施例的另一方面,还提供了一种logo的识别装置,包括:获取模块,用于获取样本logo图像的全局图像与局部图像;提取模块,用于通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;学习模块,用于对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;输出模块,用于将学习完成之后的第二模型输出为残缺logo识别模型。
14.进一步地,所述获取模块包括:截取单元,用于对样本logo图像进行随机切割,截取获得m张相同尺寸的局部图像,其中,所述局部图像的尺寸小于所述样本logo图像的尺寸,m为大于1的正整数;增强单元,用于对所述样本logo图像进行n次增强操作,得到n张全局图像,其中,所述全局图像的尺寸与所述样本logo图像的尺寸相同,n为大于1的正整数。
15.进一步地,所述增强单元包括:第一增强子单元,用于对所述样本logo图像进行第一增强操作,得到第一全局图像,所述第一增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强;第二增强子单元,用于对所述样本logo图像进行第二增强操作,得到第二全局图像,所述第二增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强,其中,所述n张全局图像包括所述第一全局图像和所述第二全局图像。
16.进一步地,所述学习模块还包括:获取单元,用于获取监督学习的样本数据,其中,所述样本数据包括样本图像数据和对应所述样本图像数据的分类标签数据;
17.训练单元,用于采用所述样本数据训练所述第一模型。
18.进一步地,所述样本图像数据为所述样本logo图像,所述获取单元包括:判断子单元,用于解析所述样本logo图像,判断所述样本logo图像中是否包含标注数据信息;确定子单元,用于若所述样本logo图像中包含标注数据信息,将所述标注数据信息确定为所述样本图像数据的分类标签数据;若所述样本logo图像中不包含标注数据信息,接收输入的人
工标签数据,将所述人工标签数据确定为所述样本图像数据的分类标签数据。
19.进一步地,所述第一特征向量包括多个第一子向量,所述第二特征向量包括多个第二子向量,所述学习模块包括:计算单元,用于针对每个所述第二子向量,分别计算与每个所述第一子向量之间的欧式空间距离;判断单元,用于判断所述欧式空间距离是否大于预设约束值;执行单元,用于若所述欧式空间距离大于预设约束值,执行以下步骤,直到所述第一特征向量中的任一第一子向量与所述第二特征向量中的任一第二子向量之间的欧式空间距离均小于或等于所述预设约束值:采用所述第二模型的损失函数更新所述第二模型的模型参数,并采用更换后的第二模型重新提取所述全局图像和所述局部图像的第二特征向量。
20.进一步地,所述logo的识别装置还包括:接收模块,用于接收待识别的目标logo图像,其中,所述目标logo图像为残缺的logo图像;第二提取模块,用于采用所述残缺logo识别模型提取所述目标logo图像的目标特征向量;检索模块,用于在图像库中检索与所述目标特征向量最匹配的logo图案;第二输出模块,用于将所述logo图案输出为所述目标logo图像的识别结果。
21.根据本技术实施例的另一方面,还提供了一种存储介质,该存储介质包括存储的程序,其中,程序运行时执行上述的方法步骤。
22.根据本技术实施例的另一方面,还提供了一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行上述的方法步骤。
23.本技术实施例还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述方法中的步骤。
24.本方案可以应用于深度学习技术领域的计算机视觉中,通过本发明,获取样本logo图像的全局图像与局部图像;通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;将学习完成之后的第二模型输出为残缺logo识别模型,通过采用自监督学习的方式,将全局图像的特征向量逼近局部图像的特征向量,从而使得第二模型和第一模型的输出结果逼近,可以使得第二模型从残缺logo图像中提取出与完整logo相似的特征向量,实现了一种logo的识别方法,解决了相关技术中logo的识别准确率不够高的技术问题,提高了对残缺logo图像的识别准确率。
附图说明
25.此处所说明的附图用来提供对本发明的进一步理解,构成本技术的一部分,本发明的示意性实施例及其说明用于解释本发明,并不构成对本发明的不当限定。在附图中:
26.图1是本发明实施例的一种logo的客户端的硬件结构框图;
27.图2是根据本发明实施例的一种logo的识别方法的流程图;
28.图3是本发明实施例的整体流程图;
29.图4是根据本发明实施例的一种logo的识别装置的结构框图。
具体实施方式
30.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。
31.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
32.实施例1
33.本技术实施例一所提供的方法实施例可以在客户端、计算机、服务器、控制设备或者类似的运算装置中执行。以运行在客户端上为例,图1是本发明实施例的一种logo的客户端的硬件结构框图。如图1所示,客户端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,可选地,上述客户端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述客户端的结构造成限定。例如,客户端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
34.存储器104可用于存储操作客户端的程序,例如,应用软件的软件程序以及模块,如本发明实施例中的一种logo的识别方法对应的识别程序,处理器102通过运行存储在存储器104内的识别程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至客户端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
35.传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括客户端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
36.在本实施例中提供了一种logo的识别方法,图2是根据本发明实施例的一种logo的识别方法的流程图,如图2所示,该流程包括如下步骤:
37.步骤s202,获取样本logo图像的全局图像与局部图像;
38.其中,全局图像是样本logo图像的完整图像,包括全部logo标识,局部图像是样本
logo图像残缺/不完整图像,局部图像只包括部分logo标识。
39.步骤s204,通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;
40.本实施例的一个实施方式中,获取到样本logo图像后,经过处理获得全局图像与局部图像,并通过第一模型与第二模型来提取所述图像的特征向量。可选的,第一模型为教师模型,通过教师模型来获取全局图像的第一特征向量,第二模型为学生模型,通过学生模型来获取全局图像与局部图像的第二特征向量。
41.可选的,教师模型和学生模型都是使用的卷积神经网络(convolutional neural networks,cnn)的网络结构,模型将图像经过多层卷积和维度变换之后,生成最后的特征向量。
42.步骤s206,对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;
43.本实施例的一个实施方式中,对第一模型和第二模型,即教师模型和学生模型进行自监督学习,使第二特征向量逼近第一特征向量,在上述步骤中,使学生模型能够根据预测局部特征获得与全局特征相近的效果。
44.步骤s208,将学习完成之后的第二模型输出为残缺logo识别模型。
45.上述步骤中,通过全局和局部自监督学习的方式,将学习完成的第二模型即学生模型输出为残缺logo识别模型,通过该模型可对出现被遮挡的残缺logo进行识别,使得网络结构对于部分露出的logo依然能表现较好的性能表征,提高了logo识别的准确率。
46.通过上述步骤,获取样本logo图像的全局图像与局部图像;通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;将学习完成之后的第二模型输出为残缺logo识别模型,通过采用自监督学习的方式,将全局图像的特征向量逼近局部图像的特征向量,从而使得第二模型和第一模型的输出结果逼近,可以使得第二模型从残缺logo图像中提取出与完整logo相似的特征向量,实现了一种logo的识别方法,解决了相关技术中logo的识别准确率不够高的技术问题,提高了对残缺logo图像的识别准确率。
47.在本实施例中,获取样本logo图像的全局图像与局部图像包括:对样本logo图像进行随机切割,截取获得m张相同尺寸的局部图像,其中,所述局部图像的尺寸小于所述样本logo图像的尺寸,m为大于1的正整数;对所述样本logo图像进行n次增强操作,得到n张全局图像,其中,所述全局图像的尺寸与所述样本logo图像的尺寸相同,n为大于1的正整数。
48.在上述步骤中,通过对样本logo图像进行处理获得全局图像与局部图像,其中,通过对样本logo图像进行随机切割,截取获得m张局部图像,可知的,切割获得的图像尺寸大小随机,也可设定为同一尺寸的局部图像。
49.本实施例的一个实施方式中,对样本logo图像进行增强操作获得n张全局图像,可选的,用增强操作对于样本logo图像做一次数据增强生成一张增强后的图像,同时,为了能够一定程度上的丰富每一轮训练的数据量,又因为增强方案是一个概率集合,即增强图像是随机的以不一定的概率的增强图像,如其中一个增强操作是概率百分之30的概率选择,那么增强的图可能百分之30的概率为增强操作图像,也有可能为原图。基于上述原因,对样
本logo图像进行n次增强操作,获得n张全局图像,这n张全局图像部分可能使用了不同的增强手段,部分可能为原图。
50.可选的,将样本logo图像随机切分成8张局部图像,每一份的大小占原图大小的三分之二,将样本logo图像进行两次增强操作,生成两张增强的全局图像。这样选择数据的原因是如果每张局部图像的信息太少,网络可能无法收敛,学习不到想要的内容,如果每张局部图像太大,无法起到解决logo遮挡的问题。
51.在本实施例中,对所述样本logo图像进行n次增强操作,得到n张全局图像包括:对所述样本logo图像进行第一增强操作,得到第一全局图像,所述第一增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强;对所述样本logo图像进行第二增强操作,得到第二全局图像,所述第二增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强,其中,n=2,所述n张全局图像包括所述第一全局图像和所述第二全局图像。
52.在上述步骤中,执行两次增强操作,包括第一增强操作和第二增强操作,获得第一全局图像与第二全局图像,其中,增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强。增强操作可以选择几何变化或颜色变换,其中,旋转、模糊、裁剪、翻转为单样本数据增强,属于几何变化类,噪声增强为颜色变换类。
53.在本实施例中,在对所述第一模型和所述第二模型进行自监督学习之前,所述方法还包括:获取监督学习的样本数据,其中,所述样本数据包括样本图像数据和对应所述样本图像数据的分类标签数据;采用所述样本数据训练所述第一模型。
54.在上述步骤中,通过所述样本数据,即样本图像数据和对应的分类标签数据可对第一模型进行训练,其中,样本图像数据有对应的标注信息,教师模型可以通过标注的约束学习相应的特征,进一步的指导学生模型网络的学习。上述步骤是为了保障教师模型的准确率,通过分类标签作为最终的约束避免教师模型指导出的学生模型出错的情形。教师模型不仅能给到logo图像一个特征表达,而且使分类器能根据这个特征向量,分类出其对应的类别。即使部分logo图像没有分类标签,但是部分图带有,对部分图像的分类约束也能使得教师模型向正确的方向学习。在网络的训练过程中,约束教师模型的特征表达,与教师模型和学生模型的自监督学习中的相似度计算是同时进行的,两者并不冲突。
55.在本实施例中,所述样本图像数据为所述样本logo图像,获取监督学习的样本数据包括:解析所述样本logo图像,判断所述样本logo图像中是否包含标注数据信息;若所述样本logo图像中包含标注数据信息,将所述标注数据信息确定为所述样本图像数据的分类标签数据;若所述样本logo图像中不包含标注数据信息,接收输入的人工标签数据,将所述人工标签数据确定为所述样本图像数据的分类标签数据。
56.在上述步骤中,解析样本logo图像,并判断是否包含标注数据信息,若包含则确定为分类标签数据,若不包含则接收输入的人工标签数据。可选的,训练与测试不相同,上述步骤为训练时的分类标签数据的获取,测试时部分logo图像并不在训练集中,此时无法进行分类,如分类标签数据在训练时有abc三类,而测试时包含d类,此时仅需要计算d类别的特征向量,属于d的类别在检索时特征距离最近。
57.在本实施例中,所述第一特征向量包括多个第一子向量,所述第二特征向量包括多个第二子向量,对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量包括:针对每个所述第二子向量,分别计算与每个所述第一子向
量之间的欧式空间距离;判断所述欧式空间距离是否大于预设约束值;若所述欧式空间距离大于预设约束值,执行以下步骤,直到所述第一特征向量中的任一第一子向量与所述第二特征向量中的任一第二子向量之间的欧式空间距离均小于或等于所述预设约束值:采用所述第二模型的损失函数更新所述第二模型的模型参数,并采用更换后的第二模型重新提取所述全局图像和所述局部图像的第二特征向量。
58.在上述步骤中,第一特征向量与第二特征向量包括多个子向量,即对每一张局部图像与全局图像均生成一个特征向量。可选的,当通过第一模型即教师模型处理两张全局图像时,生成两个特征向量,当通过第二模型即学生模型处理两张全局图像与8张局部图像时,生成十个特征向量。
59.所做的约束,是让学生模型生成的向量与教师模型生成的向量做一一的对比,使其欧式空间的距离最小,因此设定一个预设约束值,可进一步约束达到学生模型学习局部特征并向全局特征靠近的目的。训练中,通过损失函数来更新第二模型的模型参数,可选的,测试中也可各自通过损失函数来更新模型参数。
60.在网络的训练中,会对学生模型的结果和教师模型的结果做欧式距离损失,期望得到的损失越小,因此通过这种距离损失就可以约束学生模型,学习到和教师模型差不多的特征表示。上述步骤为对于第二模型生成的所有图像的表征与第一模型生成的所有图像的表征进行相似度的比较,使得网络能够学习到更好的局部特征。
61.在本实施例中,在将学习完成之后的第二模型输出为残缺logo识别模型之后,所述方法还包括:接收待识别的目标logo图像,其中,所述目标logo图像为残缺的logo图像;采用所述残缺logo识别模型提取所述目标logo图像的目标特征向量;在图像库中检索与所述目标特征向量最匹配的logo图案;将所述logo图案输出为所述目标logo图像的识别结果。
62.在上述步骤中,通过自监督学习完成的第二模型输出为残缺logo识别模型,在测试中,接收待识别的目标logo图像,并提取目标特征向量,图像库中存储着相应图像的表征向量,在图像库中检索与目标特征向量最近的logo图案,以最近的logo图的类别判定目标logo图像的识别结果。
63.图3是本实施例的整体流程图,logo图输入后做数据增强,获得据图图像和全局图像,将局部图像和全局图像输入到学生模型中处理,全局图像输入到教师模型中处理,若图像有标签的话计算其分类结果,通过学生模型与教师模型生成的特征向量进行相似度的计算,使学生模型能学习局部特征并向全局特征靠近。
64.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到根据上述实施例的方法可借助软件加必需的通用机械设备的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对相关技术做出贡献的部分可以以软件控制机械设备的形式体现出来,该软件存储在一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台机械设备(识别装置等)执行本发明各个实施例所述的方法。
65.实施例2
66.在本实施例中还提供了一种logo的识别装置,用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件
和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
67.图4是根据本发明实施例的一种logo的识别装置的结构框图,如图4所示,该装置包括:获取模块40,提取模块42,学习模块44,输出模块46,其中,
68.获取模块40,用于获取样本logo图像的全局图像与局部图像;
69.提取模块42,用于通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;
70.学习模块44,用于对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;
71.输出模块46,用于将学习完成之后的第二模型输出为残缺logo识别模型。
72.可选的,所述获取模块包括:截取单元,用于对样本logo图像进行随机切割,截取获得m张相同尺寸的局部图像,其中,所述局部图像的尺寸小于所述样本logo图像的尺寸,m为大于1的正整数;增强单元,用于对所述样本logo图像进行n次增强操作,得到n张全局图像,其中,所述全局图像的尺寸与所述样本logo图像的尺寸相同,n为大于1的正整数。
73.可选的,所述增强单元包括:第一增强子单元,用于对所述样本logo图像进行第一增强操作,得到第一全局图像,所述第一增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强;第二增强子单元,用于对所述样本logo图像进行第二增强操作,得到第二全局图像,所述第二增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强,其中,所述n张全局图像包括所述第一全局图像和所述第二全局图像。
74.可选的,所述学习模块还包括:获取单元,用于获取监督学习的样本数据,其中,所述样本数据包括样本图像数据和对应所述样本图像数据的分类标签数据;
75.训练单元,用于采用所述样本数据训练所述第一模型。
76.可选的,所述样本图像数据为所述样本logo图像,所述获取单元包括:判断子单元,用于解析所述样本logo图像,判断所述样本logo图像中是否包含标注数据信息;确定子单元,用于若所述样本logo图像中包含标注数据信息,将所述标注数据信息确定为所述样本图像数据的分类标签数据;若所述样本logo图像中不包含标注数据信息,接收输入的人工标签数据,将所述人工标签数据确定为所述样本图像数据的分类标签数据。
77.可选的,所述第一特征向量包括多个第一子向量,所述第二特征向量包括多个第二子向量,所述学习模块包括:计算单元,用于针对每个所述第二子向量,分别计算与每个所述第一子向量之间的欧式空间距离;判断单元,用于判断所述欧式空间距离是否大于预设约束值;执行单元,用于若所述欧式空间距离大于预设约束值,执行以下步骤,直到所述第一特征向量中的任一第一子向量与所述第二特征向量中的任一第二子向量之间的欧式空间距离均小于或等于所述预设约束值:采用所述第二模型的损失函数更新所述第二模型的模型参数,并采用更换后的第二模型重新提取所述全局图像和所述局部图像的第二特征向量。
78.可选的,所述logo的识别装置还包括:接收模块,用于接收待识别的目标logo图像,其中,所述目标logo图像为残缺的logo图像;第二提取模块,用于采用所述残缺logo识别模型提取所述目标logo图像的目标特征向量;检索模块,用于在图像库中检索与所述目标特征向量最匹配的logo图案;第二输出模块,用于将所述logo图案输出为所述目标logo
图像的识别结果。
79.需要说明的是,上述各个模块是可以通过软件或硬件来实现的,对于后者,可以通过以下方式实现,但不限于此:上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
80.实施例3
81.本发明的实施例还提供了一种存储介质,该存储介质中存储有计算机程序,其中,该计算机程序被设置为运行时执行上述任一项方法实施例中的步骤。
82.可选地,在本实施例中,上述存储介质可以被设置为存储用于执行以下步骤的计算机程序:
83.s1,获取样本logo图像的全局图像与局部图像;
84.s2,通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;
85.s3,对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;
86.s4,将学习完成之后的第二模型输出为残缺logo识别模型。
87.可选地,在本实施例中,上述存储介质可以包括但不限于:u盘、只读存储器(read-only memory,简称为rom)、随机存取存储器(random access memory,简称为ram)、移动硬盘、磁碟或者光盘等各种可以存储计算机程序的介质。
88.本发明的实施例还提供了一种电子设备,包括存储器和处理器,该存储器中存储有计算机程序,该处理器被设置为运行计算机程序以执行上述任一项方法实施例中的步骤。
89.可选地,上述电子设备还可以包括传输设备以及输入输出设备,其中,该传输设备和上述处理器连接,该输入输出设备和上述处理器连接。
90.可选地,在本实施例中,上述处理器可以被设置为通过计算机程序执行以下步骤:
91.s1,获取样本logo图像的全局图像与局部图像;
92.s2,通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;
93.s3,对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;
94.s4,将学习完成之后的第二模型输出为残缺logo识别模型。
95.可选地,本实施例中的具体示例可以参考上述实施例及可选实施方式中所描述的示例,本实施例在此不再赘述。
96.上述本技术实施例序号仅仅为了描述,不代表实施例的优劣。
97.在本技术的上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
98.在本技术所提供的几个实施例中,应该理解到,所揭露的技术内容,可通过其它的方式实现。其中,以上所描述的装置实施例仅仅是示意性的,例如所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互
之间的耦合或直接耦合或通信连接可以是通过一些接口,单元或模块的间接耦合或通信连接,可以是电性或其它的形式。
99.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
100.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
101.所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对相关技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
102.以上所述仅是本技术的优选实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
技术特征:1.一种logo的识别方法,其特征在于,包括:获取样本logo图像的全局图像与局部图像;通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;将学习完成之后的第二模型输出为残缺logo识别模型。2.如权利要求1所述的方法,其特征在于,获取样本logo图像的全局图像与局部图像包括:对样本logo图像进行随机切割,截取获得m张相同尺寸的局部图像,其中,所述局部图像的尺寸小于所述样本logo图像的尺寸,m为大于1的正整数;对所述样本logo图像进行n次增强操作,得到n张全局图像,其中,所述全局图像的尺寸与所述样本logo图像的尺寸相同,n为大于1的正整数。3.如权利要求2所述的方法,其特征在于,对所述样本logo图像进行n次增强操作,得到n张全局图像包括:对所述样本logo图像进行第一增强操作,得到第一全局图像,所述第一增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强;对所述样本logo图像进行第二增强操作,得到第二全局图像,所述第二增强操作包括以下之一:旋转、模糊、裁剪、翻转、噪声增强,其中,所述n张全局图像包括所述第一全局图像和所述第二全局图像。4.如权利要求1所述的方法,其特征在于,在对所述第一模型和所述第二模型进行自监督学习之前,所述方法还包括:获取监督学习的样本数据,其中,所述样本数据包括样本图像数据和对应所述样本图像数据的分类标签数据;采用所述样本数据训练所述第一模型。5.如权利要求4所述的方法,其特征在于,所述样本图像数据为所述样本logo图像,获取监督学习的样本数据包括:解析所述样本logo图像,判断所述样本logo图像中是否包含标注数据信息;若所述样本logo图像中包含标注数据信息,将所述标注数据信息确定为所述样本图像数据的分类标签数据;若所述样本logo图像中不包含标注数据信息,接收输入的人工标签数据,将所述人工标签数据确定为所述样本图像数据的分类标签数据。6.如权利要求1所述的方法,其特征在于,所述第一特征向量包括多个第一子向量,所述第二特征向量包括多个第二子向量,对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量包括:针对每个所述第二子向量,分别计算与每个所述第一子向量之间的欧式空间距离;判断所述欧式空间距离是否大于预设约束值;若所述欧式空间距离大于预设约束值,执行以下步骤,直到所述第一特征向量中的任一第一子向量与所述第二特征向量中的任一第二子向量之间的欧式空间距离均小于或等于所述预设约束值:采用所述第二模型的损失函数更新所述第二模型的模型参数,并采用
更换后的第二模型重新提取所述全局图像和所述局部图像的第二特征向量。7.如权利要求1所述的方法,其特征在于,在将学习完成之后的第二模型输出为残缺logo识别模型之后,所述方法还包括:接收待识别的目标logo图像,其中,所述目标logo图像为残缺的logo图像;采用所述残缺logo识别模型提取所述目标logo图像的目标特征向量;在图像库中检索与所述目标特征向量最匹配的logo图案;将所述logo图案输出为所述目标logo图像的识别结果。8.一种logo的识别装置,其特征在于,包括:获取模块,用于获取样本logo图像的全局图像与局部图像;提取模块,用于通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;学习模块,用于对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;输出模块,用于将学习完成之后的第二模型输出为残缺logo识别模型。9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,所述程序运行时执行上述权利要求1至7中任一项所述的方法步骤。10.一种电子设备,包括处理器、通信接口、存储器和通信总线,其中,处理器,通信接口,存储器通过通信总线完成相互间的通信;其中:存储器,用于存放计算机程序;处理器,用于通过运行存储器上所存放的程序来执行权利要求1至7中任一项所述的方法步骤。
技术总结本发明公开了一种LOGO的识别方法及装置、存储介质、电子设备。其中,该方法包括获取样本LOGO图像的全局图像与局部图像;通过第一模型提取所述全局图像的第一特征向量,通过第二模型提取所述全局图像和所述局部图像的第二特征向量;对所述第一模型和所述第二模型进行自监督学习,以使所述第二特征向量逼近所述第一特征向量;将学习完成之后的第二模型输出为残缺LOGO识别模型。通过本发明,解决了相关技术中LOGO的识别准确率不够高的技术问题,提高了对残缺LOGO图像的识别准确率。对残缺LOGO图像的识别准确率。对残缺LOGO图像的识别准确率。
技术研发人员:朱彦浩 胡郡郡 唐大闰
受保护的技术使用者:北京明略昭辉科技有限公司
技术研发日:2022.03.30
技术公布日:2022/7/5