本发明属于乳腺超声图像分割模型,具体涉及一种基于扩散概率模型的乳腺超声图像分割网络。
背景技术:
1、随着社会的发展,人们的生活方式和饮食习惯有了很大的改变,由于不合理的饮食结构和生活习惯,导致乳腺癌的发病率不断上升。在全球疾病中,乳腺癌占据比较大的比例且疾病类型繁多,其中乳腺肿瘤是乳腺疾病的重要因素。乳腺肿瘤的诊断和治疗需要专业的放射科医生对乳腺组织的健康状况进行观察分析才能做出进一步的治疗方案。因此,提高术前的诊断效率,医学影像尤为重要。在乳腺超声图像分析领域,乳腺肿瘤分割是疾病检测和识别的关键技术,也是图像处理过程中最困难的任务之一。乳腺肿瘤分割是将乳腺超声图像中的肿瘤区域或感兴趣区域进行精确的分割和定位,以便医生能够更好地评估肿瘤的状况并制订相应的治疗方案。图9展示了一张乳腺超声图像以及对应的真实分割掩模,因为乳腺组织的复杂性(包括腺体、脂肪、结缔组织等)和肿瘤形态的多样性,同时由于乳腺组织中的相同结构(如纤维组织和腺体组织)在超声图像中的回声特性相似,感兴趣区域之间缺乏清晰界限,使得进行乳腺肿瘤分割来说非常具有挑战性。
2、早期的一些乳腺超声图像分割方法主要使用基于阈值、基于区域、基于边缘的传统图像处理算法,但医学图像不同于自然图像具有良好的清晰度,通常存在噪声、低对比度和不均匀曝光的问题,依靠人工提取特征往往达不到对乳腺肿瘤的精确分割。
3、近年来,随着深度学习的发展,深度卷积神经网络被广泛应用于图像分割领域。相比基于手工特征的图像分割算法,数据驱动的深度学习网络能够提取更加丰富的特征结构,且模型具有良好的泛化能力和更加准确的预测结果,对多样化细分问题极为有效。在基于深度学习的乳腺超声图像分割中,包括经典的卷积神经网络(cnn)、对抗神经网络(gan)和流行的transformer模型被广泛地应用于乳腺超声图像的分割任务中。例如,almajalid等人基于u-net模型构建了乳腺超声图像分割框架,结合预处理技术提高乳腺图像分割的质量。lin等使用transformer代替cnn,建立了用于乳腺肿块分割的视觉transformer,并取得了与使用卷积相当的性能。由于乳腺超声图像通常会受到噪声和伪影干扰,cnn、gan和transformer这些方法在复杂结构的建模能力以及去噪过程有着天然的局限性,设计一种能够建模复杂结构和处理数据生成过程中噪声的算法尤为重要。
技术实现思路
1、为解决现有技术存在的技术问题,本发明提供了一种基于扩散概率模型的乳腺超声图像分割网络,用于乳腺超声图像中的肿瘤分割,通过使用一个u-net网络对乳腺肿瘤进行粗分割来减少扩散过程中的噪声方差,从而提高最终的分割精度;为了进一步提高乳腺超声图像的分割性能,本发明提出了一种全局注意力模块,添加到进行粗分割的条件模型中,突出条件模型编码器-解码器瓶颈层的重要特征;本发明通过扩散模型预测的噪声,对一个标准的正态分布进行逐步采样来获得精细的乳腺肿瘤分割结果。
2、为实现上述目的,本发明所采用的技术方案为:一种基于扩散概率模型的乳腺超声图像分割网络,包括对乳腺肿瘤进行粗分割的条件模型和进行噪声预测的扩散模型。
3、通过空频融合模块将条件模型中的编码器最后一层输出特征和扩散模型中的编码器最后一层输出特征进行特征融合。在条件模型中引入全局注意力模块(gam),使用该模块旨在捕获条件特征的全局上下文信息,条件模型对乳腺肿瘤图像粗分割,使用真实的乳腺肿瘤掩模对其进行约束,在u-net网络中嵌入transfomer神经网络作为扩散模型的网络结构,扩散模型学习输入的噪声特征,将条件模型编码器的输出特征与扩散模型的输出特征通过空频融合模块进行融合,空频融合模块能够学习滤除频域中的不相关特征,以便两种特征进行有意义的融合,测试过程中通过从随机生成的标准正态分布的噪声中预测正向添加的噪声,然后逐步采样降噪得到最终的乳腺肿瘤分割图。
4、本分割网络包括由一对编码器-解码器组成的双输入双输出结构,编码器的块与块之间使用最大池化减少特征尺寸以提取不同尺度的特征,解码器中使用双线性插值算法逐层恢复图像分辨率,将条件模型中的条件特征添加到扩散模型中,以减少扩散模型的输出方差,补充乳腺肿瘤的区域特征和轮廓特征,解码器的输出分别使用真实的分割掩模和标准正态分布进行监督约束。
5、将条件模型的条件特征添加到扩散模型中,在条件模型中,使用全局注意力模块捕获条件特征的全局上下文信息。该模块遵循transformer神经网络中的多头自注意力机制,在该机制中,每个输入向量都会生成对应的query(q)向量、key(k)向量、value(v)向量。通过计算查询向量与键向量的点积并通过softmax函数归一化获得注意力得分,这些得分用于加权求和值向量,从而能够先后捕获条件特征通道与通道之间的位置关系、像素与像素之间的位置关系。在扩散模型中,使用空频融合模块融合条件模型中的条件特征和扩散模型的噪声特征,该模块使用快速傅里叶变换和逆傅里叶变换将噪声特征和条件特征从空间域变换到频域进行滤波处理,然后再从频域变换到空间域,以达到对两种特征的有效融合。除此之外,将条件模型解码器的输出特征经过上采样后与扩散模型的解码器输出特征相加以减少扩散模型输出噪声方差。
6、乳腺超声图像数据集中每张图像均有一个对应的乳腺肿瘤分割二进制掩模图,乳腺超声图像是一个像素级的二分类任务,即乳腺肿瘤区域和背景两个类别,使用均方差(mse)损失作为优化网络的损失函数,均方差损失函数定义如式(1)所示:
7、
8、其中,lmse表示均方误差损失函数,n表示总的像素数,i表示第i个像素,xi表示模型的预测输出像素,yi表示真实标签的像素。
9、用l表示总的损失函数,定义如式(2)所示:
10、l=lmse(xs,ys)+lmse(xn,yn) (2)
11、其中,xs表示模型预测粗分割图,ys表示真实的分割掩模图,xn表示模型预测的噪声图,yn表示服从标准正态分布的真实噪声图。
12、本发明与现有技术相比,具体有益效果体现在:本发明通过引入扩散概率模型作为乳腺超声图像的分割任务,在数据生成过程中具有较强的灵活性,这种方式允许模型在生成高质量图像时更好地捕捉数据分布,适用于处理复杂的医学超声图像;在特征提取过程中具有对全局特征的捕捉能力,扩散概率模型通过多次迭代去噪过程,可以更好地融合全局和局部信息;其次,扩散模型因其对噪声的建模能力,对医学图像中存在的噪声具有天然的鲁棒性。
1.一种基于扩散概率模型的乳腺超声图像分割网络,其特征在于,包括对乳腺超声图像进行分割的条件模型和进行噪声预测的扩散模型;
2.根据权利要求1所述的一种基于扩散概率模型的乳腺超声图像分割网络,其特征在于,包括由一对编码器-解码器组成的双输入双输出结构,编码器的块与块之间使用最大池化减少特征尺寸以提取不同尺度的特征,解码器中使用双线性插值算法逐层恢复图像分辨率,将条件模型中的条件特征添加到扩散模型中,减少扩散模型的输出方差,补充乳腺超声图像的区域特征和轮廓特征,解码器的输出分别使用真实的分割掩模和标准正态分布进行监督。
3.根据权利要求2所述的一种基于扩散概率模型的乳腺超声图像分割网络,其特征在于,将条件模型的条件特征添加到扩散模型中,在条件模型中,使用全局注意力模块捕获条件特征的全局上下文信息,该模块遵循transfomer神经网络中的多头自注意力机制,每个输入向量均生成对应的query向量、key向量和value向量,计算查询向量与键向量的点积并通过softmax函数归一化获得注意力得分,注意力得分用于加权求和值向量,捕获条件特征通道与通道之间的位置关系、像素与像素之间的位置关系,在扩散模型中,使用空频融合模块融合条件模型中的条件特征和扩散模型的噪声特征,使用快速傅里叶变换和逆傅里叶变换将噪声特征和条件特征从空间域变换到频域进行滤波处理,然后再从频域变换到空间域,融合噪声特征和条件特征。
4.根据权利要求3所述的一种基于扩散概率模型的乳腺超声图像分割网络,其特征在于,在编码器和解码器之间引入跳跃连接,将低层特征直接传递到对应的高层特征中,在扩散模型中引入时间嵌入,使用多尺度特征融合策略,在扩散模型解码中补充条件模型解码器不同尺度上提取的特征。
5.根据权利要求4所述的一种基于扩散概率模型的乳腺超声图像分割网络,其特征在于,在乳腺超声图像数据集中,每张图像均有一个对应的乳腺肿瘤分割二进制掩模图,乳腺超声图像是一个像素级的二分类任务,即乳腺肿瘤区域和背景两个类别,使用均方差损失函数作为优化网络的损失函数,均方差损失函数定义如式(1)所示: