肺腺癌患者生存期预后评估方法、计算机装置及存储介质

allin2022-08-01  131



1.本发明涉及生物医学技术领域,特别是一种肺腺癌患者生存期预后评估方法、计算机装置及存储介质。


背景技术:

2.生存风险预测是医疗安全管理系统中极为重要的一环,根据积累的病况数据进行整理分析,总结出风险预测的方法,有利于指导患者个体化治疗。
3.在中国,肺癌的发病率和致死率在各种恶性肿瘤中排名第一,对我国人民带来巨大的健康和经济负担
1.。根据组织学类型,肺癌可分为小细胞癌、腺癌、鳞癌、大细胞癌等,其中肺腺癌占肺癌的40%以上,是肺癌中数量最多的类型
2.。国际抗癌联盟第八版 tnm分期根据肿瘤大小、血管神经侵犯情况、淋巴结及远处组织转移等临床病理特征将患者分为i、ii、iii及iv期
3.。目前,tnm分期是临床医生预测肺癌患者生存的主要依据,然而其预测效率仍不令人满意
4.,寻找新的预后预测方案是目前亟待解决的问题。而发现预后相关的分子靶标,建立分子-tnm分期联合预测模型是目前最有效的解决方案之一。
4.正常细胞在蛋白质稳定的条件下,内质网应激传感器,包括激活转录因子6(atf6)、肌醇需要酶1α(ire1α)和prkr样内质网激酶(perk)处于失活状态。而在肿瘤微环境中,多种因素,如缺氧、营养供应异常、细胞内活性氧的积累和低ph可干扰内质网中的蛋白质折叠
[5-8]
。错误折叠蛋白质的积累打破了蛋白质稳定,激活了传感器,从而促使癌细胞产生强烈的内质网应激。传感器的激活可促进未折叠蛋白反应(upr),该反应可恢复内质网稳态,并促进细胞适应应激和增强生存能力
[9]
。有趣的是,内质网应激只有在中度时才起到致癌作用。不受控制的内质网应激引起的过度upr会导致细胞死亡
[10]

[0005]
内质网应激在肺腺癌中的作用仍有争议。一项研究报告,pou4f3的过度表达上调了内质网应激,因此抑制了肺腺癌中的肿瘤进展
[11]
。活性氧介导的内质网应激抑制肺癌细胞中的肿瘤
[12]
。内质网应激途径可能不受中性粒细胞精氨酸酶-1的调节,由激活的人中性粒细胞或死亡细胞释放,并诱导癌细胞凋亡
[13]
。此外,据报道,内质网应激也与肺细胞的顺铂耐药性有关
[14]
。然而也有研究报道内质网应激可能在肺癌中发挥促癌作用, yamashita等人的研究发现内质网应激促进了肺腺癌中的上皮间充质转化和细胞入侵
[15]
。总之,这些发现表明内质网应激在肺腺癌中可能是一个很有希望的治疗靶点,对内质网应激与肺腺癌之间的关系进行全面的探讨有重要价值。


技术实现要素:

[0006]
本发明所要解决的技术问题是,针对现有技术不足,提供一种肺腺癌患者生存期预后评估方法、计算机装置及存储介质,解决应用tnm分期无法准确评估患者生存期的问题。
[0007]
为解决上述技术问题,本发明所采用的技术方案是:一种肺腺癌患者生存期预后评估方法,采用下式计算预后指数,并利用所述预后指数评估肺腺癌患者死亡风险:
[0008]
预后指数=β1*tnm分期+β2*erss;
[0009]
其中,β1和β2为权重系数,0<β1<5,0<β2<5;当tnm分期为i时,赋值为1,分期为ii时,赋值为2,分期为iii时,赋值为3,分期为iv时,赋值为4;erss 为内质网应激评分;erss=λ1*serpinh1表达量+λ2*dsg2表达量+λ3*gpr37表达量+λ4*pcsk9表达量+λ5*trpa1表达量+λ6*f2表达量+λ7*cdkn3表达量-λ 8*dmd表达量-λ9*nr3c2表达量-λ10*cftr表达量-λ11*cyp1a2表达量-λ 12*mapt表达量-λ13*syt2表达量-λ14*cyp2d6表达量-λ15*scn4a表达量-λ 16*nupr1表达量-λ17*pik3cg表达量-λ18*derl3表达量;λ1~λ18的取值范围均为0~1。
[0010]
本发明中,通过survivalroc包计算预后指数预测患者1年、3年、5年总体生存率的约登指数,进而得到预后指数预测患者1年、3年、5年的最佳截断点分别为7.477722、 7.672388和7.437397
[16]
。如要预测患者确诊1年后的生存情况,使用7.477722作为预后指数截点,预测价值最佳,当预后指数》7.477722时,预测患者状态为死亡,当预后指数≤7.477722时,预测患者状态为存活。同理,如要预测患者确诊3年后的生存情况,使用7.672388作为预后指数截点,预测价值最佳,当预后指数》7.672388时,预测患者状态为死亡,当预后指数≤7.672388时,患者状态为存活。如要预测患者确诊5年后的生存情况,使用7.437397作为预后指数截点,预测价值最佳,当erss》7.437397时,预测患者状态为死亡,当预后指数≤7.437397时,预测患者状态为存活。
[0011]
本发明采用tnm分期和erss结合的方式,计算预后指数,利用该预后指数评估肺腺癌患者生存期,roc曲线表明结合tnm分期和erss对肺腺癌患者的生存有更好的预测效果,解决了应用tnm分期无法准确评估患者生存期的问题。
[0012]
cox回归分析表明当β1取1.58167,β2取3.41433时,本发明方法的生存预测效果最好。
[0013]
lasoo回归表明当λ1取0.13882291,λ2取0.09216343,λ3取0.07294183,λ 4取0.06978185,λ5取0.06473978,λ6取0.03490076,λ7取0.02606376,λ8取 0.01049731,λ9取0.01071941,λ10取0.01443196,λ11取0.01872414,λ12取 0.01915136,λ13取0.03551274,λ14取0.03613574,λ15取0.0400695,λ16取0.0432351,λ17取0.07008271,λ18取0.0722234时,erss的生存预测效果最好。
[0014]
本发明中,内质网应激评分erss的计算过程包括:
[0015]
1)筛选相关系数大于7分的内质网应激相关基因n1个;
[0016]
2)过r语言limma包对所述n1个内质网应激相关基因进行差异表达分析,得到肿瘤组织和癌旁组织显著差异表达的内质网应激相关基因n2个;
[0017]
3)通过r语言survival包对所述n2个内质网应激相关基因进行单因素cox回归筛选,得到与患者总生存期显著相关的基因n3个;
[0018]
4)通过维恩图取所述n2个内质网应激相关基因与n3个与患者总生存期显著相关的基因的交集,获得n4个既与总生存期显著相关,又在肿瘤组织中显著差异表达的内质网应激基因;
[0019]
5)通过r语言glmnet包进行lasso回归,对所述n4个基因进一步筛选,得到 18个内质网应激的关键基因,并给每个基因赋予权重系数,得到内质网应激评分erss。
[0020]
本发明筛选基因的过程主要技术优势在于:
[0021]
1)本发明对内质网应激相关基因进行筛选,在建立预测模型(erss)的同时,首次全面分析了内质网应激与肺腺癌患者生存期的关系;
[0022]
2)本发明通过肿瘤组织和正常组织的差异表达分析、单因素cox生存分析、lasso 回归分析、多因素cox回归分析层层递进的方法,筛选出与肺腺癌发生、发展和患者生存密切相关的关键基因,相对tnm分期,本发明的评估过程更加客观、准确。
[0023]
作为一个发明构思,本发明还提供了一种基于内质网应激评分的肺腺癌患者生存期预后评估方法,采用下式计算内质网应激评分erss,并利用所述内质网应激评分erss 评估肺腺癌患者死亡风险:
[0024]
erss=λ1*serpinh1表达量+λ2*dsg2表达量+λ3*gpr37表达量+λ4*pcsk9 表达量+λ5*trpa1表达量+λ6*f2表达量+λ7*cdkn3表达量-λ8*dmd表达量-λ 9*nr3c2表达量-λ10*cftr表达量-λ11*cyp1a2表达量-λ12*mapt表达量-λ 13*syt2表达量-λ14*cyp2d6表达量-λ15*scn4a表达量-λ16*nupr1表达量-λ17*pik3cg表达量-λ18*derl3表达量;其中,λ1~λ18的取值范围均为0~1。
[0025]
本发明中,通过survivalroc包计算erss预测患者1年、3年、5年总体生存率的约登指数,进而得到erss预测患者1年、3年、5年的最佳截断点分别为1.520982、 1.516202和1.828536
[16]
。如要预测患者确诊1年后的生存情况,使用1.520982作为erss 截点,预测价值最佳,当erss》1.520982时,预测患者状态为死亡,当erss≤1.520982 时,预测患者状态为存活。同理,如要预测患者确诊3年后的生存情况,使用1.516202 作为erss截点,预测价值最佳,当erss》1.516202时,预测患者状态为死亡,当erss ≤1.516202时,患者状态为存活。如要预测患者确诊5年后的生存情况,使用1.828536 作为erss截点,预测价值最佳,当erss》1.828536时,预测患者状态为死亡,当erss ≤1.828536时,预测患者状态为存活。
[0026]
多因素cox分析表明erss是独立于tnm分期之外的预后风险因素(图2(b),图3(e),图3(h)),即对于同一tnm分期的患者,erss仍可以很好地预测患者疗效。例如,在gse30219队列中,由于94.5%的患者是i期(表1),tnm分期已经无法预测患者生存,此时erss可作为预测患者生存的主要依据(图3(b))。
[0027]
本发明还提供了一种肺腺癌患者生存期预后系统,其包括列线图,所述列线图第一行为得分标尺,所述得分标尺分值范围为0~100;
[0028]
第二行为内质网应激评分erss分值标尺,erss分值范围为0~3.5,且erss分值标尺的长度与所述得分标尺长度相同,erss分值0对应得分标尺的分值0,erss分值3.5对应得分标尺的分值100;
[0029]
第三行为tnm分期标尺,tnm分期值范围为1~4,所述tnm分期值1对应得分标尺分值0,tnm分期值4对应得分标尺的分值32;
[0030]
第四行为总得分标尺,总得分标尺的分值范围为0~140,且所述总得分标尺的长度与所述得分标尺长度相同;
[0031]
所述得分标尺左端点、erss分值标尺左端点、tnm分期标尺左端点、总得分标尺左端点对齐;所述得分标尺右端点、erss分值标尺右端点、总得分标尺左端点对齐;
[0032]
第五行为生存率大于1年的概率,概率值范围为0.95~0.05,概率值0.95对应总得分标尺分值38,0.05对应总得分标尺分值132;
[0033]
第六行为生存率大于3年的概率,概率值范围为0.95~0.05,概率值0.95对应总得
分标尺分值18,0.05对应总得分标尺分值112;
[0034]
第七行为生存率大于5年的概率,概率值范围为0.9~0.05,概率值0.95对应总得分标尺分值22,0.05对应总得分标尺分值99;
[0035]
将erss分值对应的得分标尺的值与tnm分期对应的得分标尺的值相加,得到总得分值,总得分值对应的第五行~第七行概率值,分别为肺腺癌患者1年以上、3年以上、5年以上的生存概率;
[0036]
所述内质网应激评分erss由上述方法计算得到。
[0037]
本发明中列线图的技术优势主要有:1)与单纯应用tnm分期相比,本发明的列线图中加入了erss这一指标,联合erss和tnm分期比单独应用tnm分期能更准确地预测患者生存期;2)列线图能直观地展示本发明构建的预测模型,临床中也能很方便地应用该模型。
[0038]
作为一个发明构思,本发明还提供了一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;所述处理器执行所述计算机程序,以实现本发明方法的步骤。
[0039]
作为一个发明构思,本发明还提供了一种计算机程序产品,包括计算机程序/指令;该计算机程序/指令被处理器执行时实现本发明方法的步骤。
[0040]
作为一个发明构思,本发明还提供了一种计算机可读存储介质,其上存储有计算机程序/指令;所述计算机程序/指令被处理器执行时实现本发明方法的步骤。
[0041]
与现有技术相比,本发明所具有的有益效果为:本发明根据机器学习方法评估内质网应激相关基因与肺腺癌患者预后的相关性,建立内质网应激评分,并联合内质网应激评分与tnm分期建立生存预测模型,实验表明,本发明的生存预测模型对总生存期有较好的预测作用,解决了单独应用tnm分期无法准确评估患者生存期的问题。
附图说明
[0042]
图1为本发明实施例在tcga队列中构建erss的过程:图1(a)对内质网应激相关基因在肿瘤组织和正常组织的差异表达分析,发现54个基因在肿瘤组织显著上调, 103个基因显著下调,607个基因没有明显差别;图1(b)维恩图对差异表达基因和生存显著相关基因取交集,获得45个与生存显著相关的差异表达基因;图1(c)—图1 (d)通过lasso回归对45个基因进一步筛选,发现18个关键基因;图1(e)18个关键基因的表达热图;图1(f)构成erss的18个基因的系数;
[0043]
图2为本发明实施例在tcga队列中评估erss的预后意义,及建立erss和tnm 分期联合模型的过程:图2(a)erss高的肺腺癌患者总生存期显著更短(p《0.0001);图2(b)多因素cox回归表明tnm分期和erss是影响患者生存的独立危险因素;图 2(c)根据通过列线图将tnm分期和erss联合预测模型可视化以方便临床应用;图2(d)erss对肺腺癌患者1年、3年、5年死亡风险的预测效能;图2(e)tnm分期对肺腺癌患者1年、3年、5年死亡风险的预测效能;图2(f)tnm分期和erss联合模型对肺腺癌患者1年、3年、5年死亡风险的预测效能。
[0044]
图3为本发明实施例在geo队列中外部验证联合模型的过程:在gse30219队列中,图3(a)k-m生存曲线表明erss高表达的患者总生存期显著更短(p=0.005);图3(b)cox回归表明erss是唯一的独立风险因素;图3(c)联合模型对肺腺癌患者1年、3年、5年死亡风险的预测效能分别为0.775、0.675和0.658。在gse31210队列中,图3(d)k-m生存曲线表明erss高表达的患者总生存期更短(p=0.059);图 3(e)cox回归表明tnm分期和erss均是独立风险
因素;(f)联合模型对肺腺癌患者1年、3年、5年死亡风险的预测效能分别为0.919、0.799和0.717。在gse72094队列中,图3(g)k-m生存曲线表明erss高表达的患者总生存期更短(p=0.0035);图3(h)cox回归表明tnm分期和erss均是独立风险因素;图3(i)联合模型对肺腺癌患者1年、3年、5年死亡风险的预测效能分别为0.695、0.710和0.739。
[0045]
图4为本发明预后风险模型使用举例。
具体实施方式
[0046]
本发明实施例联合生存预测模型的具体构建方法如下:
[0047]
(1)通过ucsc xena网站(https://xenabrowser.net/),从癌症基因组图谱(tcga)数据库中获得517例肺腺癌患者的基因表达和临床数据,从geo数据库 (http://www.ncbi.nlm.nih.gov/geo/)获得gse30219、gse31210和gse720924三个队列肺腺癌患者的基因表达和临床数据,其中tcga队列作为训练集用于内质网应激评分、预测模型构建,geo队列作为验证集用于预测模型的外部验证,表1显示了四个队列患者的临床特征。
[0048]
表1 tcga队列与geo队列肺腺癌患者临床病理特征
[0049][0050]
(2)从geencards网站(https://www.genecards.org/)下载并筛选相关系数》7分的内质网应激相关基因共799个;
[0051]
(3)通过r语言limma包
[17]
对内质网应激相关基因进行差异表达分析,得到肿瘤组织和癌旁组织显著差异表达的内质网应激基因157个(图1(a));
[0052]
(4)通过r语言survival包
[18]
对上述内质网应激相关基因进行单因素cox回归筛选与患者总生存期显著相关的基因共153个(图1(b));
[0053]
(5)通过维恩图取交集,获得既与总生存期显著相关,又在肿瘤组织中显著差异表达的内质网应激基因共45个(图1(b));
[0054]
(6)通过r语言glmnet包进行lasso回归
[19]
,对上述基因进一步筛选,得到18个内质网应激的关键基因(图1(c)-图1(d)),并给每个基因赋予权重系数(图1(e)~图1(f)),建立内质网应激评分(erss,endoplasmic reticulum stress score),公式如下:
[0055]
erss=λ1*serpinh1表达量+λ2*dsg2表达量+λ3*gpr37表达量+λ4*pcsk9表达量+λ5*trpa1表达量+λ6*f2表达量+λ7*cdkn3表达量-λ8*dmd表达量-λ 9*nr3c2表达量-λ10*cftr表达量-λ11*cyp1a2表达量-λ12*mapt表达量-λ 13*syt2表达量-λ14*cyp2d6表达量-λ15*scn4a表达量-λ16*nupr1表达量-λ 17*pik3cg表达量-λ18*derl3表达量;λ1~λ18的取值范围在0到1,其中各系数最佳取值为:λ1取0.13882291,λ2取0.09216343,λ3取0.07294183,λ4取0.06978185,λ5取0.06473978,λ6取0.03490076,λ7取0.02606376,λ8取0.01049731,λ9取 0.01071941,λ10取0.01443196,λ11取0.01872414,λ12取0.01915136,λ13取 0.03551274,λ14取0.03613574,λ15取0.0400695,λ16取0.0432351,λ17取0.07008271,λ18取0.0722234;
[0056]
上述公式中:serpinh1,丝氨酸蛋白酶抑制剂h1;dsg2,桥粒芯糖蛋白2;gpr37, g蛋白偶联受体37;pcsk9,前蛋白转化酶枯草溶菌素9蛋白;trpa1,瞬时受体电位通道蛋白1;f2,凝血因子ⅱ重组蛋白;cdkn3,周期素依赖性激酶抑制因子3;nr3c2,盐皮质激素受体基因;dmd,杜氏肌营养不良蛋白;cftr是一种囊性纤维化跨膜电导调节因子;cyp1a2,细胞色素氧化酶;mapt,微管相关蛋白tau;syt2,突触结合蛋白2;cyp2d6是细胞色素p450家族成员之一;scn4a,电压门控钠通道的α亚基; nupr1,转录调节因子核蛋白1。
[0057]
(7)根据erss中位值将患者分为erss高表达(共252例)和erss低表达组(共252 例)后,通过r语言survival包进行k-m生存分析
[18]
验证erss的生存预后意义,发现高erss患者os(总生存期)显著更短(图2(a));
[0058]
(8)通过r语言survival包进行多因素cox比例风险回归
[18]
,明确erss和tnm分期是肺腺癌患者生存的独立危险因素,而年龄、性别、吸烟史与生存无明显相关性(图2 (b));
[0059]
(9)排除年龄、性别、吸烟史,通过cox回归建立erss和tnm分期联合生存预测模型,模型计算公式如下:
[0060]
预后指数=β1*tnm分期+β2*erss;
[0061]
其中当tnm分期为i时,赋值为1,分期为ii时,赋值为2,分期为iii时,赋值为3,分期为iv时,赋值为4。β1和β2的取值范围在0到5,其中个系数最佳取值为:β1 取1.58167,β2取3.41433。
[0062]
图2(c)展示了通过r语言rms包将模型可视化的列线图
[20]
,目的是方便临床应用:图中第一行为分值标尺,第二行为erss,范围是0到3.5,对应分值为0-100分,第三行为tnm分期,范围为1-4,对应分值为0-32分,第四行为总分值,为各因素得分之和,第五行为模型预测患者1年的生存率,第六行模型预测患者3年的生存率,第七行为模型预测患者5年的生
存率。模型的应用的具体实例将在后续内容中展示。
[0063]
在列线图中,tnm分期的范围是1到4,erss的范围是0到3.5,tnm分期和erss 的nomogram系数转换公式为:
[0064]
nomogram
tnm分期
=log(β1)
×
(4-1)=1.37544;
[0065]
nomogram
erss
=log(β2)
×
(3.5-0)=4.29793;
[0066]
erss的nomogram系数最大表明其对预测结果的影响最大,因此将erss分值范围设置为0-100,将tnm分期分值范围设置为100
×
(1.37544/4.29793)≈32。erss在列线图中的得分=100*(erss/3.5),tnm分期在列线图中的得分=32*(tnm分期/4)。表2展示了系数转换后排序及赋分结果。
[0067]
表2系数转换后排序及赋分结果
[0068][0069]
通过roc曲线分别评估erss、tnm和联合模型对患者1年、3年、5年生存的预测效能(图2(d)~图2(f))。
[0070]
在3个geo队列中,分别通过k-m生存分析和多因素cox回归验证erss的生存预测价值,再通过roc曲线验证联合模型的预测价值。
[0071]
在gsea30219队列中,高erss患者总生存期显著更短(p=0.005,图3(a)), erss是该队列中唯一的独立风险因素(图3(b)),roc曲线提示联合模型对总生存期有较好的预测作用(1年auc=0.775,3年auc=0.675,5年auc=0.658;图3(c))。
[0072]
在gsea31210队列中,高erss患者总生存期更短(p=0.059,图3(d)),erss 和tnm分期是患者总生存的独立风险因素(图3(e)),roc曲线提示联合模型对总生存期有很好的预测作用(1年auc=0.919,3年auc=0.799,5年auc=0.717;图 3(f))。
[0073]
在gsea72094队列中,高erss患者总生存期显著更短(p=0.0035;图3(g)), erss和tnm分期是患者总生存的独立风险因素(图3(h)),roc曲线提示联合模型对总生存期有较好的预测作用(1年auc=0.695,3年auc=0.710,5年auc=0.739;图3i)。
[0074]
以下举例说明风险模型(预测模型)应用的具体方法,如图4所示:若一个患者的 erss为1.5,tnm分期为iv期,从第二行(erss)和第三行(tnm分期)分别往第一行(分值标尺)做垂直线即可得到erss和tnm分期在列线图中的得分,大约分别为43和32分,两者相加即得总得分,约为:43+32=75分。从第四行(总得分)分别往第五、六、七行做垂直线即得到患者1
年、3年、5年的生存率,分别约为78%、56%和36%。
[0075]
参考文献
[0076]
[1]gaos,lin,wangs,etal.lungcancerinpeople'srepublicofchina[j].jthoraconcol,2020,15(10):1567-76.
[0077]
[2]gantiak,kleinab,cotarlai,etal.updateofincidence,prevalence,survival,andinitialtreatmentinpatientswithnon-smallcelllungcancerintheus[j].jamaoncol,2021.
[0078]
[3]hwangjk,pagebj,flynnd,etal.validationoftheeightheditiontnmlungcancerstagingsystem[j].jthoraconcol,2020,15(4):649-54.
[0079]
[4]yunjk,leegd,kimhr,etal.validationofthe8theditionofthetnmstagingsystemin3,950patientswithsurgicallyresectednon-smallcelllungcancer[j].jthoracdis,2019,11(7):2955-64.
[0080]
[5]youngrm,ackermand,quinnzl,etal.dysregulatedmtorc1renderscellscriticallydependentondesaturatedlipidsforsurvivalundertumor-likestress[j].genesdev,2013,27(10):1115-31.
[0081]
[6]weiy,wangd,topczewskif,etal.saturatedfattyacidsinduceendoplasmicreticulumstressandapoptosisindependentlyofceramideinlivercells[j].amjphysiolendocrinolmetab,2006,291(2):e275-81.
[0082]
[7]shimizuy,hendershotlm.oxidativefolding:cellularstrategiesfordealingwiththeresultantequimolarproductionofreactiveoxygenspecies[j].antioxidredoxsignal,2009,11(9):2317-31.
[0083]
[8]dongl,krewsonea,yanglv.acidosisactivatesendoplasmicreticulumstresspathwaysthroughgpr4inhumanvascularendothelialcells[j].internationaljournalofmolecularsciences,2017,18(2).
[0084]
[9]walterp,rond.theunfoldedproteinresponse:fromstresspathwaytohomeostaticregulation[j].science,2011,334(6059):1081-6.
[0085]
[10]chenx,cubillos-ruizjr.endoplasmicreticulumstresssignalsinthetumouranditsmicroenvironment[j].natrevcancer,2021,21(2):71-88.
[0086]
[11]chaix,dingx,lyux,etal.pou4f3actsasatumorsuppressorinlungadenocarcinomaviatheendoplasmicreticulumstresssignalingpathway[j].jcancer,2022,13(2):554-64.
[0087]
[12]songx,xux,luj,etal.lampreyimmuneproteinmediatesapoptosisoflungcancercellsviatheendoplasmicreticulumstresssignalingpathway[j].frontoncol,2021,11:663600.
[0088]
[13]garc
í
a-navasr,gajatec,mollinedof.neutrophilsdriveendoplasmicreticulumstress-mediatedapoptosisincancercellsthrougharginase-1release[j].scirep,2021,11(1):12574.
[0089]
[14]wangx,chenb,xud,etal.delicaflavonereversescisplatinresistanceviaendoplasmicreticulumstresssignalingpathwayinnon-small
celllungcancercells[j].oncotargetsther,2020,13:10315-22.
[0090]
[15]yamashitam,ogasawaram,kawasakiy,etal.deficiencyofprotein-l-isoaspartate(d-aspartate)o-methyl-transferaseexpressionunderendoplasmicreticulumstresspromotesepithelialmesenchymaltransitioninlungadenocarcinoma[j].oncotarget,2018,9(17):13287-300.
[0091]
[16]heagertypj,lumleyt,pepems.time-dependentroccurvesforcensoredsurvivaldataandadiagnosticmarker[j].biometrics,2000,56(2):337-44.
[0092]
[17]ritchieme,phipsonb,wud,etal.limmapowersdifferentialexpressionanalysesforrna-sequencingandmicroarraystudies[j].nucleicacidsres,2015,43(7):e47.
[0093]
[18]loprinzicl,laurieja,wieandhs,etal.prospectiveevaluationofprognosticvariablesfrompatient-completedquestionnaires.northcentralcancertreatmentgroup[j].jclinoncol,1994,12(3):601-7.
[0094]
[19]friedmanj,hastiet,tibshiranir.regularizationpathsforgeneralizedlinearmodelsviacoordinatedescent[j].jstatsoftw,2010,33(1):1-22.
[0095]
[20]parksy.nomogram:ananaloguetooltodeliverdigitalknowledge[j].jthoraccardiovascsurg,2018,155(4):1793。

技术特征:
1.一种肺腺癌患者生存期预后评估方法,其特征在于,采用下式计算预后指数:预后指数=β1*tnm分期+β2*erss;其中,β1和β2为权重系数,0<β1<5,0<β2<5;当tnm分期为i时,赋值为1,分期为ii时,赋值为2,分期为iii时,赋值为3,分期为iv时,赋值为4;erss为内质网应激评分;erss=λ1*serpinh1表达量+λ2*dsg2表达量+λ3*gpr37表达量+λ4*pcsk9表达量+λ5*trpa1表达量+λ6*f2表达量+λ7*cdkn3表达量-λ8*dmd表达量-λ9*nr3c2表达量-λ10*cftr表达量-λ11*cyp1a2表达量-λ12*mapt表达量-λ13*syt2表达量-λ14*cyp2d6表达量-λ15*scn4a表达量-λ16*nupr1表达量-λ17*pik3cg表达量-λ18*derl3表达量;λ1~λ18的取值范围均为0~1;利用所述预后指数评估肺腺癌患者死亡风险。2.根据权利要求1所述的肺腺癌患者生存期预后评估方法,其特征在于,β1取1.58167,β2取3.41433。3.根据权利要求1所述的肺腺癌患者生存期预后评估方法,其特征在于,λ1取0.13882291,λ2取0.09216343,λ3取0.07294183,λ4取0.06978185,λ5取0.06473978,λ6取0.03490076,λ7取0.02606376,λ8取0.01049731,λ9取0.01071941,λ10取0.01443196,λ11取0.01872414,λ12取0.01915136,λ13取0.03551274,λ14取0.03613574,λ15取0.0400695,λ16取0.0432351,λ17取0.07008271,λ18取0.0722234。4.根据权利要求1~3之一所述的肺腺癌患者生存期预后评估方法,其特征在于,内质网应激评分erss的计算过程包括:1)筛选相关系数大于7分的内质网应激相关基因n1个;2)过r语言limma包对所述n1个内质网应激相关基因进行差异表达分析,得到肿瘤组织和癌旁组织显著差异表达的内质网应激相关基因n2个;3)通过r语言survival包对所述n2个内质网应激相关基因进行单因素cox回归筛选,得到与患者总生存期显著相关的基因n3个;4)通过维恩图取所述n2个内质网应激相关基因与n3个与患者总生存期显著相关的基因的交集,获得n4个既与总生存期显著相关,又在肿瘤组织中显著差异表达的内质网应激基因;5)通过r语言glmnet包进行lasso回归,对所述n4个基因进一步筛选,得到18个内质网应激的关键基因,并给每个基因赋予权重系数,得到内质网应激评分erss。5.一种基于内质网应激评分的肺腺癌患者生存期预后评估方法,其特征在于,采用下式计算内质网应激评分erss:erss=λ1*serpinh1表达量+λ2*dsg2表达量+λ3*gpr37表达量+λ4*pcsk9表达量+λ5*trpa1表达量+λ6*f2表达量+λ7*cdkn3表达量-λ8*dmd表达量-λ9*nr3c2表达量-λ10*cftr表达量-λ11*cyp1a2表达量-λ12*mapt表达量-λ13*syt2表达量-λ14*cyp2d6表达量-λ15*scn4a表达量-λ16*nupr1表达量-λ17*pik3cg表达量-λ18*derl3表达量;其中,λ1~λ18的取值范围均为0~1;利用所述内质网应激评分erss评估肺腺癌患者死亡风险;优选地,λ1取0.13882291,λ2取0.09216343,λ3取0.07294183,λ4取0.06978185,λ5取0.06473978,λ6取0.03490076,λ7取0.02606376,λ8取0.01049731,λ9取0.01071941,λ10取
0.01443196,λ11取0.01872414,λ12取0.01915136,λ13取0.03551274,λ14取0.03613574,λ15取0.0400695,λ16取0.0432351,λ17取0.07008271,λ18取0.0722234。6.根据权利要求5所述的基于内质网应激评分的肺腺癌患者生存期预后评估方法,其特征在于,内质网应激评分erss的计算过程包括:1)筛选相关系数大于7分的内质网应激相关基因n1个;2)过r语言limma包对所述n1个内质网应激相关基因进行差异表达分析,得到肿瘤组织和癌旁组织显著差异表达的内质网应激相关基因n2个;3)通过r语言survival包对所述n2个内质网应激相关基因进行单因素cox回归筛选,得到与患者总生存期显著相关的基因n3个;4)通过维恩图取所述n2个内质网应激相关基因与n3个与患者总生存期显著相关的基因交集,获得n4个既与总生存期显著相关,又在肿瘤组织中显著差异表达的内质网应激基因;5)通过r语言glmnet包进行lasso回归,对所述n4个基因进一步筛选,得到18个内质网应激的关键基因,并给每个基因赋予权重系数,得到内质网应激评分erss。7.一种肺腺癌患者生存期预后系统,其特征在于,包括列线图,所述列线图第一行为得分标尺,所述得分标尺分值范围为0~100;第二行为内质网应激评分erss分值标尺,erss分值范围为0~3.5,且erss分值标尺的长度与所述得分标尺长度相同,erss分值0对应得分标尺的分值0,erss分值3.5对应得分标尺的分值100;第三行为tnm分期标尺,tnm分期值范围为1~4,所述tnm分期值1对应得分标尺分值0,tnm分期值4对应得分标尺的分值32;第四行为总得分标尺,总得分标尺的分值范围为0~140,且所述总得分标尺的长度与所述得分标尺长度相同;所述得分标尺左端点、erss分值标尺左端点、tnm分期标尺左端点、总得分标尺左端点对齐;所述得分标尺右端点、erss分值标尺右端点、总得分标尺左端点对齐;第五行为生存率大于1年的概率,概率值范围为0.95~0.05,概率值0.95对应总得分标尺分值38,0.05对应总得分标尺分值132;第六行为生存率大于3年的概率,概率值范围为0.95~0.05,概率值0.95对应总得分标尺分值18,0.05对应总得分标尺分值112;第七行为生存率大于5年的概率,概率值范围为0.9~0.05,概率值0.95对应总得分标尺分值22,0.05对应总得分标尺分值99;将erss分值对应的得分标尺的值与tnm分期对应的得分标尺的值相加,得到总得分值,总得分值对应的第五行~第七行概率值,分别为肺腺癌患者1年以上、3年以上、5年以上的生存概率;所述内质网应激评分erss由权利要求5或6所述方法计算得到。8.一种计算机装置,包括存储器、处理器及存储在存储器上的计算机程序;其特征在于,所述处理器执行所述计算机程序,以实现权利要求1~4之一所述方法的步骤,或者实现权利要求5或6所述方法的步骤。9.一种计算机程序产品,包括计算机程序/指令;其特征在于,该计算机程序/指令被处
理器执行时实现权利要求1~4之一所述方法的步骤,或者实现权利要求5或6所述方法的步骤。10.一种计算机可读存储介质,其上存储有计算机程序/指令;其特征在于,所述计算机程序/指令被处理器执行时实现权利要求1~4之一所述方法的步骤,或者实现权利要求5或6所述方法的步骤。

技术总结
本发明公开了一种肺腺癌患者生存期预后评估方法、计算机装置及存储介质,采用下式计算预后指数:预后指数=β1*TNM分期+β2*ERSS;其中,β1和β2为权重系数,ERSS为内质网应激评分。本发明根据机器学习方法评估内质网应激相关基因与肺腺癌患者预后的相关性,建立内质网应激评分,并联合内质网应激评分与TNM分期建立生存预测模型,实验表明,本发明的生存预测模型对总生存期有较好的预测作用,解决了单独应用TNM分期无法准确评估患者生存期的问题。问题。问题。


技术研发人员:陶永光 舒龙 刘双
受保护的技术使用者:中南大学
技术研发日:2022.03.31
技术公布日:2022/7/5
转载请注明原文地址: https://www.8miu.com/read-2396.html

最新回复(0)