本发明属于肿瘤治疗及诊断,特别涉及一种肿瘤新抗原的筛选方法。
背景技术:
1、肿瘤是指机体在各种致瘤因子作用下,局部组织细胞增生所形成的新生物,因为这种新生物多呈占位性块状突起,也称赘生物,根据新生物的细胞特性及对机体的危害性程度,又将肿瘤分为良性肿瘤和恶性肿瘤两大类,而肿瘤特异性抗原指仅表达于某种肿瘤细胞表面而不存在于正常细胞上的新抗原,故又称独特肿瘤抗原。
2、此类抗原可存在于不同个体同一组织类型的肿瘤中,如人恶性黑色素瘤基因编码的黑色素瘤特异性抗原可存在于不同个体的黑色素瘤细胞,但正常黑色素细胞不表达,tsa也可为不同组织学类型的肿瘤所共有,如突变的ras癌基因产物可见于消化道、肺癌等,但由于其氨基酸顺序与正常原癌基因ras表达产物存在差异,可被机体的免疫系统所识别,激发机体的免疫系统攻击并消除肿瘤细胞。
3、目前对于肿瘤疫苗的研制都是通过实验的手段进行一一的筛选,该过程费时、费力、花费较大,且不易找到合适的肿瘤疫苗(肿瘤抗原),因此,目前亟需一种肿瘤新抗原的筛选方法,通过对肿瘤新抗原的筛选获取合适的肿瘤疫苗,以方便后续进一步的据此进行针对性的实验,以大大的减少实验的次数,实现省时、省力且增加筛选精准度的效果。
技术实现思路
1、本发明的目的在于针对现有的一种肿瘤新抗原的筛选方法,其优点是,通过对肿瘤新抗原的筛选获取合适的肿瘤疫苗,以方便后续进一步的据此进行针对性的实验,以大大的减少实验的次数,实现省时、省力且增加筛选精准度的效果。
2、本发明的上述技术目的是通过以下技术方案得以实现的:一种肿瘤新抗原的筛选方法,包括如下几个步骤:
3、a:获取肿瘤组织细胞的突变基因所对应编码的各个多肽序列,并将其作为潜在抗原的多肽集合;
4、b;获取各个hla分型在人群中的频率并据此获取频率超过指定阈值的hla分型集合;并将所述多肽集合中的多肽序列与所述hla分型集合中的hla分型分别进行亲和力预测,并筛选出亲和力超过指定阈值的多肽序;
5、c:将超过指定阈值的多肽序进行分子对接,然后将所述分子对接的打分值中超过指定阈值时对应的多肽序列作为肿瘤新抗原的候选多肽序列;
6、d:用荧光报告基团和荧光淬灭基团将所述候选的多肽序列进行修饰,然后固定在载体上;
7、e:获取所述样本的pbmc,将固定有所述候选多肽序列的载体置于所述pbmc中进行细胞培养;
8、f:待所述细胞培养结束后,检测所述载体上的荧光信号,根据所述荧光信号筛选出肿瘤新抗原:所述载体上的阳性发光区域对应的候选多肽序列即为所述肿瘤新抗原。
9、本发明进一步设置为:所述步骤a中,多肽序列中的测序为二代测序方法,其也称深度测序、大规模平行测序,其核心思想是边合成边测序,即通过捕捉新合成的末端的标记来确定dna的序列,所述步骤a中测序需要对原始测序数据进行质控、序列比对及过滤。
10、本发明进一步设置为:所述步骤a中的二代测序方法包括以下几个步骤:
11、a1、提取肿瘤组织细胞的dna,并对其进行dna测序;
12、a2、将测序后的dna序列与正常的野生型的该组织细胞的dna序列进行比对,获取突变的dna序列;
13、a3、通过生物学软件获取所述突变的dna序列对应编码的多肽序列。
14、本发明进一步设置为:所述步骤d中,其中,每种所述候选多肽序列在载体上具有独立区域。
15、本发明进一步设置为:所述步骤d中,其中所述载体表面修饰有巯基、马来酰亚胺基、氨基、羧基中的至少一种化学基团,所述载体通过所述化学基团与所述候选多肽序列连接固定。
16、本发明进一步设置为:所述步骤d中,其中所述载体的表面设置有多个凹槽,每个所述凹槽内用于连接固定一种所述候选多肽序列,所述载体为载体为二维阵列芯片。
17、本发明进一步设置为:所述步骤c中,其中将hla分型的三维结构模型作为受体,将多肽序列的三维结构模型作为配体进行分子对接。
18、本发明进一步设置为:所述步骤b中,还包括使用机器学习框架归纳整合并排序肿瘤特异性抗原的免疫原性。
19、本发明进一步设置为:所述使用机器学习框架归纳整合并排序肿瘤特异性抗原的免疫原性首先需要构架并训练机器学习模型整合多维度肿瘤特异抗原的呈递性信息;其次整合优化已有软件预测肿瘤特异抗原与hla结合的稳定性信息;然后优化已有软件计算肿瘤特异抗原识别性信息;最后运用统计学方法整合以上信息预测肿瘤特异抗原的免疫原性。
20、本发明进一步设置为:所述机器学习包括以下算法:逻辑回归算法、支持向量机算法、随机森林算法、人工神经网络算法、长短期记忆网络算法、深度学习等。
21、综上所述,本发明具有以下有益效果:
22、1、本申请提供的肿瘤新抗原的筛选方法,通过获取潜在抗原的多肽集合,以及根据hla分型在人群中的频率获取高频的hla分型集合,并将两者亲和力预测以及进行分子对接打分,方便后续进一步的根据所述候选多肽序列进行针对性的实验,操作简单,以及通过述荧光报告基团和所述荧光淬灭基团用于修饰与肿瘤患者样本的hla基因型和候选抗原突变位点所在序列对应的氨基酸序列;用该载体培养肿瘤患者样本的pbmc后,即可根据荧光信号筛选肿瘤新抗原,可高通量检测多个候选的多肽序列,已达到批量筛选肿瘤新抗原的目的,大大的减少实验的次数,实现省时、省力且增加筛选精准度的效果;
23、2、本发明使用机器学习模型整合不同维度肿瘤特异抗原呈递性的信息,使用统计学方法高效整合多重信息预测肿瘤特异抗原免疫原性,保证肿瘤特异性抗原在预测结果中的完整性。
1.一种肿瘤新抗原的筛选方法,其特征在于:包括如下几个步骤:
2.根据权利要求1所述的一种肿瘤新抗原的筛选方法,其特征在于:所述步骤a中,多肽序列中的测序为二代测序方法,其也称深度测序、大规模平行测序,其核心思想是边合成边测序,即通过捕捉新合成的末端的标记来确定dna的序列,所述步骤a中测序需要对原始测序数据进行质控、序列比对及过滤。
3.根据权利要求2所述的一种肿瘤新抗原的筛选方法,其特征在于:所述步骤a中的二代测序方法包括以下几个步骤:
4.根据权利要求1所述的一种肿瘤新抗原的筛选方法,其特征在于:所述步骤d中,其中,每种所述候选多肽序列在载体上具有独立区域。
5.根据权利要求1所述的一种肿瘤新抗原的筛选方法,其特征在于:所述步骤d中,其中所述载体表面修饰有巯基、马来酰亚胺基、氨基、羧基中的至少一种化学基团,所述载体通过所述化学基团与所述候选多肽序列连接固定。
6.根据权利要求1所述的一种肿瘤新抗原的筛选方法,其特征在于:所述步骤d中,其中所述载体的表面设置有多个凹槽,每个所述凹槽内用于连接固定一种所述候选多肽序列,所述载体为载体为二维阵列芯片。
7.根据权利要求1所述的一种肿瘤新抗原的筛选方法,其特征在于:所述步骤c中,其中将hla分型的三维结构模型作为受体,将多肽序列的三维结构模型作为配体进行分子对接。
8.根据权利要求1所述的一种肿瘤新抗原的筛选方法,其特征在于:所述步骤b中,还包括使用机器学习框架归纳整合并排序肿瘤特异性抗原的免疫原性。
9.根据权利要求8所述的一种肿瘤新抗原的筛选方法,其特征在于:所述使用机器学习框架归纳整合并排序肿瘤特异性抗原的免疫原性首先需要构架并训练机器学习模型整合多维度肿瘤特异抗原的呈递性信息;其次整合优化已有软件预测肿瘤特异抗原与hla结合的稳定性信息;然后优化已有软件计算肿瘤特异抗原识别性信息;最后运用统计学方法整合以上信息预测肿瘤特异抗原的免疫原性。
10.根据权利要求9所述的一种肿瘤新抗原的筛选方法,其特征在于:所述机器学习包括以下算法:逻辑回归算法、支持向量机算法、随机森林算法、人工神经网络算法、长短期记忆网络算法、深度学习等。