本发明涉及超声图像处理,具体而言,涉及一种数据分类模型训练方法、数据分类方法、电子设备及存储介质。
背景技术:
1、近年来,随着人工智能技术的发展,人工智能赋能的医疗诊断技术在淋巴结诊断上已经取得了一定的进展,构建深度神经网络学习超声图像和良恶性标签之间的模式匹配关系已成为主流的趋势。
2、高性能、高泛化性的淋巴结智能诊断方法依赖大规模、精标准的标注数据进行训练,这要求:1、数据应具有一定的规模;2、淋巴结良恶性的标注应有高年资专业医师参考病理报告进行标注。但是,尽管拥有大量的淋巴结超声图像数据,淋巴结图像的标注却存在不小的挑战,标注所有的淋巴结数据是不现实的。
技术实现思路
1、有鉴于此,本发明实施例的目的在于,提供一种数据分类模型训练方法、数据分类方法、电子设备及存储介质以至少部分地改善上述问题。
2、为了实现上述目的,本发明实施例采用的技术方案如下:
3、第一方面,本发明实施例提供了一种数据分类模型训练方法,所述方法包括:
4、获取淋巴结超声图像数据集;所述淋巴结超声图像数据集包括有标注图像以及无标注图像;所述有标注图像标注有良恶性标签;
5、将各所述有标注图像输入数据分类模型,得到预测结果,并计算出各所述预测结果与所述良恶性标签的监督损失;
6、将各所述无标注图像进行弱扰动变换以及强扰动变换,得到无标注扰动图像;
7、将各所述无标注扰动图像输入所述数据分类模型,得到预测分布,并计算出无监督损失;
8、根据所述监督损失以及所述无监督损失,计算得到整体损失;
9、根据所述整体损失对所述数据分类模型的参数进行更新,得到更新后的数据分类模型。
10、可选地,所述数据分类模型包括特征提取网络以及分类器,所述将各所述有标注图像输入数据分类模型,得到预测结果,并计算出各所述预测结果与所述良恶性标签的监督损失的步骤,包括:
11、将各所述有标注图像输入所述特征提取网络,得到各所述有标注图像的有标注深层特征;
12、将各所述有标注深层特征输入所述分类器,得到预测结果,并计算出各所述预测结果与所述良恶性标签的监督损失;所述监督损失的计算公式为:
13、
14、其中,为所述预测结果,为所述良恶性标签。
15、可选地,所述将各所述无标注图像进行弱扰动变换以及强扰动变换,得到无标注扰动图像的步骤,包括:
16、将各所述无标注图像进行弱扰动变换,得到无标注弱扰动图像;
17、在预设的强扰动集合中,随机选取n个强扰动方法;所述强扰动集合包括m个所述强扰动方法,n大于等于2且小于m;
18、根据选取的各所述强扰动方法,对各所述无标注图像进行强扰动变换,得到无标注强扰动图像。
19、可选地,所述数据分类模型包括特征提取网络、特征投影网络以及分类器,所述将各所述无标注扰动图像输入所述数据分类模型,得到预测分布,并计算出无监督损失的步骤,包括:
20、将所述各无标注弱扰动图像以及各所述无标注强扰动图像输入所述特征提取网络,得到各所述无标注弱扰动图像的第一弱扰动深层特征以及各所述无标注强扰动图像的强扰动深层特征;
21、将所述第一弱扰动深层特征输入所述特征投影网络,得到第二弱扰动深层特征;
22、将所述第一弱扰动深层特征、所述第二弱扰动深层特征以及所述强扰动深层特征输入所述分类器,分别得到第一弱扰动预测分布、第二弱扰动预测分布以及强扰动预测分布;
23、根据所述第一弱扰动预测分布、所述第二弱扰动预测分布以及所述强扰动预测分布,计算出无监督损失。
24、可选地,所述数据分类模型还包括聚合器,所述根据所述第一弱扰动预测分布、所述第二弱扰动预测分布以及所述强扰动预测分布,计算出无监督损失的步骤,包括:
25、将所述强扰动预测分布输入所述聚合器,得到强扰动下的加权平均预测分布;
26、根据所述第一弱扰动预测分布、所述第二弱扰动预测分布以及所述加权平均预测分布,计算出无监督损失。
27、可选地,所述整体损失的计算公式为:
28、loss=lossl+β(t)*lossu
29、
30、
31、其中,loss为所述整体损失,lossl为所述监督损失,lossu为所述无监督损失,β(t)为无监督损失加权值,t为训练次数;为所述加权平均预测分布,为所述强扰动预测分布,αi为预设加权系数,为所述第一弱扰动预测分布,为所述第二弱扰动预测分布,l2为均方误差损失。
32、可选地,所述方法还包括:
33、当所述数据分类模型的迭代次数小于第一预设次数时,β(t)赋值为0;
34、当所述数据分类模型的迭代次数大于等于所述第一预设次数时,其中,t为迭代次数,t为第二预设次数。
35、第二方面,本发明实施例提供了一种数据分类方法,所述方法包括:
36、获取待检测淋巴结超声图像;
37、将所述待检测淋巴结超声图像输入数据分类模型,得到所述待检测淋巴结超声图像的分类信息;所述数据分类模型由上述第一个方面中任一项所述的方法训练得到。
38、第三方面,本发明实施例提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述第一个方面中任一项所述的方法;和/或,上述第二个方面所述的方法。
39、第四方面,本发明实施例提供了一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述第一个方面中任一项所述的方法;和/或,上述第二个方面所述的方法。
40、本发明实施例提供的一种数据分类模型训练方法、数据分类方法、电子设备及存储介质,通过对有标注图像的监督损失计算,以及对未标注图像进行扰动并计算无监督损失,根据监督损失以及无监督损失对数据分类模型进行更行。从而以图像扰动和特征扰动为基础,构建了不同视图、不同维度的一致性约束流,充分利用了未标注的淋巴结超声图像信息,提高了数据分类模型的分类准确性。
41、为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
1.一种数据分类模型训练方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述数据分类模型包括特征提取网络以及分类器,所述将各所述有标注图像输入数据分类模型,得到预测结果,并计算出各所述预测结果与所述良恶性标签的监督损失的步骤,包括:
3.根据权利要求1所述的方法,其特征在于,所述将各所述无标注图像进行弱扰动变换以及强扰动变换,得到无标注扰动图像的步骤,包括:
4.根据权利要求3所述的方法,其特征在于,所述数据分类模型包括特征提取网络、特征投影网络以及分类器,所述将各所述无标注扰动图像输入所述数据分类模型,得到预测分布,并计算出无监督损失的步骤,包括:
5.根据权利要求4所述的方法,其特征在于,所述数据分类模型还包括聚合器,所述根据所述第一弱扰动预测分布、所述第二弱扰动预测分布以及所述强扰动预测分布,计算出无监督损失的步骤,包括:
6.根据权利要求5所述的方法,其特征在于,所述整体损失的计算公式为:
7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
8.一种数据分类方法,其特征在于,所述方法包括:
9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1至7任一项和/或如权利要求8所述的方法。
10.一种存储介质,其上存储有计算机程序,其特征在于:所述计算机程序被处理器执行时实现权利要求1至7任一项和/或如权利要求8所述的方法。