本发明涉及突变样本检测,特别涉及一种基于高光谱图像的肿瘤多基因检测方法。
背景技术:
1、在现有医疗技术背景下,肿瘤靶向治疗对于提高患者生存率具有重要意义。在进行肿瘤靶向治疗前,通常需要对致癌驱动基因进行检测。目前,常用的基因检测手段主要包括免疫组化(免疫组织化学技术)和基因测序。然而,这两种方法存在诸多不足。免疫组化和基因测序往往检测时间较长,成本较高,并且耗费大量的人力资源,难以满足医院和患者对快速、低成本基因检测的需求。因此,现有的检测手段在广泛应用中受到限制,亟需一种高效且经济的新型肿瘤基因检测方法。
技术实现思路
1、本发明的目的是提供一种基于高光谱图像的肿瘤多基因检测方法,以解决现有技术中基因检测方法检测时间长、成本高、应用范围有限等问题。本发明是通过利用肿瘤切片的高光谱图像信息作为训练数据,构建模型并完成训练后,能够准确识别患者组织样本中致癌驱动基因的突变水平,从而为肿瘤的靶向治疗提供一种高效、低成本且精确的基因检测手段。
2、为了实现上述发明目的,本发明提供了一种基于高光谱图像的肿瘤多基因检测方法,所述检测方法包括以下步骤:
3、步骤s1:收集肿瘤组织样本,获取经过h&e染色的不同致癌驱动基因突变状态的肿瘤组织切片,并进行低温保存;
4、步骤s2:获取环境光光谱特性,通过无荧光、白色漫反射材料作为参照物,采集参照物区域的高光谱数据,经过平均处理得到环境光特征曲线;
5、步骤s3:解冻肿瘤组织样本,通过高光谱相机拍摄肿瘤组织切片,获取肿瘤样本的高光谱图像,所述肿瘤样本的高光谱图像包括光谱维和立体空间维;
6、步骤s4:对肿瘤样本的高光谱图像进行预处理;
7、步骤s5:基于s3anet搭建全局特征提取器,其中s3anet为3d卷积神经网络与自注意力机制结合的基本结构框架,用于提取肿瘤样本的形态及光学特征,并通过自监督学习任务训练模型以自动提取高光谱数据的特征;
8、步骤s6:搭建肿瘤多基因检测模型并利用多任务学习训练,肿瘤多基因检测模型利用由s3anet提取的特征向量,通过多个任务特定层对每个基因的突变状态进行二分类,优化多个基因的检测结果;
9、步骤s7:收集待检测的肿瘤样本,通过高光谱相机获取该待检测样本的高光谱数据;
10、步骤s8:将步骤s7中获得的高光谱数据输入到经过训练的s3anet模型中进行特征提取,将得到的特征向量输入到训练好的多基因检测模型,利用该模型预测待检测肿瘤样本的基因突变状态,输出肿瘤样本的基因检测结果。
11、其中,所述步骤s1中收集的肿瘤组织样本包括携带egfr基因突变阳性及阴性、alk、fgfr1、pik3ca、kras、ercc1、rrm1和her2基因突变状态的肿瘤切片,样本来源于手术患者术后边缘游离的正常组织。该肿瘤组织样本的获取不改变手术术式或治疗方案,所有样本采集均获得患者授权,且术前未确定样本来源病人的基因突变状态。
12、所述步骤s4的预处理包括:
13、步骤s401:利用步骤s2获取的环境光特征曲线,对肿瘤样本的高光谱数据进行环境降噪处理,减去环境光光谱特征,获得降噪后的肿瘤样本高光谱数据;
14、步骤s402:对降噪后的肿瘤样本高光谱数据进行归一化处理,将光谱值转换到[0,1]范围内,通过min-max归一化方法提高数据一致性;
15、步骤s403:进行数据增强处理,包括通过图像旋转生成新的训练样本,以增强模型的泛化能力;
16、步骤s404:将高光谱图像划分为小的三维数据块,每个三维数据块均包含一定数量的相邻像素和所有光谱通道的信息,用于提升内存利用率和后期的训练效率,并采用随机梯度下降方法加速模型训练过程,避免过拟合现象。
17、其中,步骤s402中的归一化处理通过计算整个数据集中的最小值和最大值,将每个像素的光谱值减去最小值后除以最大值与最小值的差值。
18、步骤s403中的数据增强通过随机旋转角度对原始图像进行处理,模拟实际应用中的视角变化,以提高模型对不同图像形态的鲁棒性。
19、所述s3anet网络包括三维卷积神经网络(3d-cnn)模块,所述3d-cnn模块由多个卷积层、全局平均池化层和全连接层组成;
20、卷积层,用于提取高光谱图像中的空间维和光谱维的特征;
21、全局平均池化层,将提取的特征映射为固定长度的特征向量;
22、全连接层,用于提取和压缩全局特征,以便于分类任务中的特征表达。
23、所述s3anet网络还包括自注意力机制模块,所述自注意力机制通过计算高光谱图像特征之间的相似度,生成特征权重矩阵,利用该矩阵对高光谱图像特征进行加权处理,以突出重要特征,抑制冗余信息。
24、所述s3anet网络通过自监督学习进行训练,所述自监督学习包含图像重建任务,具体为:将高光谱图像输入s3anet网络,经过3d-cnn模块和自注意力机制模块处理后,输出重建的高光谱图像,所述重建任务通过计算输入图像与重建图像的光谱相似性来优化网络参数,直至最小化重建误差。
25、所述步骤s6中的多任务学习模型用于同时预测多个肿瘤基因的突变状态,所述多任务学习模型包括输入层、共享层和任务特定层;
26、所述共享层用于提取多个基因分类任务的公共特征;
27、所述任务特定层为每个基因任务独立构建,包含全连接层和sigmoid激活函数,用于二分类预测基因的突变状态。
28、所述多任务学习模型通过优化每个基因任务的独立损失函数进行训练,最终损失为所有任务损失的加权和,所述训练采用批量梯度下降法,并通过验证集评估模型的准确性、f1分数、召回率和精确率。
29、本发明的有益效果是:本发明通过高光谱成像技术、s3anet模型的全局特征提取和自监督、多任务学习方法实现肿瘤多基因的检测,有效减少了对传统病理学诊断经验和基因测序的依赖,显著提高了检测的准确性、可靠性及泛化能力,同时降低了检测成本,而且还通过提升内存利用率和训练效率,优化了系统的计算资源消耗,使得该检测方法适用于大规模数据处理。整体上,本发明为肿瘤基因分型和个性化治疗提供了高效、经济的解决方案,有助于提高癌症早期筛查率和患者预后;具体的:
30、1、本发明通过高光谱成像技术结合自动化的处理流程,能够快速获取肿瘤切片的光谱和空间信息,进而进行肿瘤基因分型。医生可根据检测结果迅速识别肿瘤的基因特征,为患者选择最适合的治疗方案,尤其是免疫抑制剂,从而缩短了诊断时间,提高了治疗效率。
31、2、采用自动化处理方法,减少了对病理学家临床经验的依赖。通过系统化的肿瘤基因检测流程,显著降低了临床诊断过程中的主观偏差,提高了诊断的准确性,避免了患者因过度治疗或治疗不足而产生的风险。
32、3、本发明采用的快速基因检测方法能够有效支持癌症早期发现与治疗,从而降低国民因癌症导致的严重健康风险。
33、4、本发明采用了结合3d卷积神经网络(3d-cnn)和自注意力机制的s3anet模型,能够集成光谱和空间信息,提取肿瘤样本的全局特征。该模型不仅提高了肿瘤基因检测的准确性,还增强了系统的可靠性。
34、5、通过将高光谱图像划分为小的三维数据块并进行数据随机化处理,本发明显著提高了内存利用效率,缩短了模型训练时间,同时减少了计算资源的消耗,适合大规模数据处理。
35、6、本发明通过自监督学习技术,减少了对大量标注数据的依赖,使模型能够在较少的标注数据条件下进行有效训练。同时,自监督学习的应用提高了模型的适应性,能够更好地应对新数据和新环境,保证检测结果的准确性和可靠性。
36、7、本发明利用多任务学习优化多个基因状态的检测任务,通过共享特征提取层,提升了模型的训练效率,并通过多个任务特定层精确分类各基因状态,进一步提高了检测结果的准确度和一致性。
37、8、通过准确的肿瘤基因分型结果,本发明为个性化医疗奠定了基础,使得治疗方案可以根据患者的具体基因特征进行定制化选择,极大提高了治疗效果,提升了患者的生存率。
1.基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述检测方法包括以下步骤:
2.根据权利要求1所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述步骤s1中收集的肿瘤组织样本包括携带egfr基因突变阳性及阴性、alk、fgfr1、pik3ca、kras、ercc1、rrm1和her2基因突变状态的肿瘤切片,样本来源于手术患者术后边缘游离的正常组织。
3.根据权利要求1所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述步骤s4的预处理包括:
4.根据权利要求3所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,步骤s402中的归一化处理通过计算整个数据集中的最小值和最大值,将每个像素的光谱值减去最小值后除以最大值与最小值的差值。
5.根据权利要求3所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,步骤s403中的数据增强通过随机旋转角度对原始图像进行处理,模拟实际应用中的视角变化。
6.根据权利要求1所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述s3anet包括三维卷积神经网络模块,所述三维卷积神经网络模块由多个卷积层、全局平均池化层和全连接层组成;
7.根据权利要求6所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述s3anet还包括自注意力机制模块,所述自注意力机制通过计算高光谱图像特征之间的相似度,生成特征权重矩阵,利用该矩阵对高光谱图像特征进行加权处理。
8.根据权利要求7所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述s3anet通过自监督学习进行训练,所述自监督学习包含图像重建任务,具体为:将高光谱图像输入s3anet,经过三维卷积神经网络模块和自注意力机制模块处理后,输出重建的高光谱图像,所述重建任务通过计算输入图像与重建图像的光谱相似性来优化网络参数,直至最小化重建误差。
9.根据权利要求1所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述步骤s6中的多任务学习模型用于同时预测多个肿瘤基因的突变状态,所述多任务学习模型包括输入层、共享层和任务特定层;
10.根据权利要求9所述的基于高光谱图像的肿瘤多基因检测方法,其特征在于,所述多任务学习模型通过优化每个基因任务的独立损失函数进行训练,最终损失为所有任务损失的加权和,所述训练采用批量梯度下降法,并通过验证集评估模型的准确性、f1分数、召回率和精确率。