1.本发明属于生物医药技术领域,具体涉及一种用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物基因标志物及其应用。
背景技术:2.自新型冠状病毒肺炎(corona virus disease 2019,covid-19)爆发以来,截至2022年3月1日,全球累积确诊人数已超过4.3亿人,累积治愈人数已超过3.6亿人。covid-19的常见临床症状为发热、咳嗽、疲乏、咳痰、气促、肌痛、关节痛等。covid-19引起的病理生理变化可对身体产生长期影响并引发持续的症状。研究表明covid-19重症患者出院后3个月内仍有严重肺功能损害的症状。对covid-19患者进行6个月的随访发现,疲劳、睡眠障碍、感觉障碍、呼吸困难是最常见的后遗症。因此,持续关注新冠肺炎康复者的健康状况是有重要临床意义的。
3.口腔微生态系统与健康和疾病密切相关。众所周知,口腔微生物菌群失调不仅会导致口腔疾病,例如龋齿、牙周炎、口腔粘膜疾病,还会涉及全身性疾病,包括胃肠系统疾病,例如炎性肠病、肝硬化、胰腺癌,神经系统疾病,例如阿尔茨海默氏病,内分泌系统性疾病,例如糖尿病、多囊卵巢综合征,免疫系统疾病,例如类风湿关节炎和心血管系统疾病,例如动脉粥样硬化。
4.人类微生物组中关健功能菌可成为人类疾病的新型生物标志物。基于微生物组建立疾病预测模型已经在多个疾病中广泛应用,flavia flaviani等率先报道了孕妇的阴道菌群特征与早产的相关性,指出2个菌种可能成为预测孕妇早产发生的微生物标志物。孙嘉等分析了51名肥胖/超重患者的肠道菌群结构,并进行了12周的不限热量的正常饮食或低碳水饮食干预,她们基于基线肠道菌群中的拟杆菌属的丰度建立了预测模型,成功地预测了短期低碳水饮食减肥效果。mi young lim等分析了91名肺腺癌患者和91名健康对照者的口腔菌群特征,并基于链球菌、巨球菌、嗜血杆菌的丰度建立了肺腺癌的预后预测模型,得到了很好的预测效能。口腔微生态的特征或者基于口腔微生物建立的预测模型作为特定疾病或肿瘤的预后工具正越来越多被广泛报道和认可。smadar shilo等对121名1型糖尿病患者(75名成年人和46名儿童)进行了研究,提出微生物组数据可以用于预测1型糖尿病患者对食物的餐后血糖反应。因而,口腔微生物可能是预测不同疾病预后的有力工具。然而,用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型还未曾报道过。
技术实现要素:5.本发明提供了一种用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物基因标志物,由seq id no:1-9所示的9种微生物基因组成。
6.》otu14
7.cctacgggtggcagcagtggggaatattggacaatgggggcaaccctgatccagcaattctgtgtgca
cgatgaaggttttcggattgtaaagtgctttcagcagggaagaaaaaaatgacggtacctgcagaagaagcgacggctaaatacgtgccagcagccgcggtaatacgtatgtcgcaagcgttatccggaattattgggcataaagggcatctaggcggccagataagtctggggtgaaaacttgcggctcaaccgcaagcctgccctggaaactatgtggctagagtactggagaggtggacggaactgcacgagtagaggtgaaattcgtagatatgtgcaggaatgccgatgatgaagatagttcactggacggtaactgacgctgaagtgcgaaagctaggggagcaaacaggattagataccctagtagtc
8.》otu28
9.cctacgggtggcagcagtggggaatattggacaatgggggcaaccctgatccagcaattctgtgtgcacgaagacggttttcggattgtaaagtgctttcagcagggaagaaggaagtgacggtacctgcagaagaagcgacggctaaatacgtgccagcagccgcggtaatacgtatgtcgcgagcgttatccggaattattgggcataaagggcatctaggcggcctaacaagtcaggggtgaaaacctgcggctcaaccgcaggcttgcctttgaaactgtaaggctggagtatcggagaggtggacggaactgcacgagtagaggtgaaattcgtagatatgtgcaggaatgccgatgatgaagatagttcactggacgataactgacgctgaagtgcgaaagccgggggagcaaacaggattagataccctagtagtc
10.》otu62
11.cctacgggtggcagcagtagggaatattgctcaatgggggaaaccctgaagcagcaacgccgcgtggaggatgacacttttcggagcgtaaactccttttcttgggaaagaattatgacggtacccaaggaataagcaccggctaactccgtgccagcagccgcggtaatacggagggtgcaagcgttactcggaatcactgggcgtaaaggacgcgtaggcggattatcaagtctcttgtgaaatctaacggcttaaccgttaaactgcttgggaaactgatagtctagagtaagggagaggcagatggaattcttggtgtaggggtaaaatccgtagagatcaagaagaatacccattgcgaaagcgatctgctggaacttaactgacgctaatgcgtgaaagcgtggggagcaaacaggattagatacccgagtagtc
12.》otu76
13.cctacgggcggcagcagtgaggaatattggtcaatggacggaagtctgaaccagccaagtagcgtgcaggatgacggccctatgggttgtaaactgcttttatgcggggataaagttagtcacgtgtgactatttgcaggtaccgcatgaataaggaccggctaattccgtgccagcagccgcggtaatacggaaggtccgggcgttatccggatttattgggtttaaagggagcgtaggccgtggattaagcgtgttgtgaaatgtagacgctcaacgtctgacttgcagcgcgaactggttcacttgagtgtgcgcaacgcaggcggaattcgtggtgtagcggtgaaatgcttagatatcacgaagaactccgattgcgaaggcagcttgcgggagcacaactgacgctgaagctcgaaagtgcgggtatcaaacaggattagatacccgagtagtc
14.》otu78
15.cctacgggtggcagcagtggggaattttggacaatgggcgcaagcctgatccagccatgccgcgtgtctgaagaaggccttcgggttgtaaaggacttttgttagggaagaaaaaggagcggttaatacccgtttctgctgacggtacctaaagaataagcaccggctaactacgtgccagcagccgcggtaatacgtagggtgcgagcgttaatcggaattactgggcgtaaagcgagcgcagacggttacttaagcaggatgtgaaatccccgggcttaacctgggaactgcgttctgaactgggtagctagagtatgtcagaggggggtagaattccacgtgtagcagtgaaatgcgtagagatgtggaggaataccgatggcgaaggcagccccctgggataatactgacgttcatgctcgaaagcgtgggtagcaaacaggattagatacccgtgtagtc
16.》otu310
17.cctacgggaggcagcagtggggaatattgcacaatgggcgaaagcctgatgcagcgacgccgcgtgagggatggaggccttcgggttgtaaacctctttcgctcatggtcaagccgcaactgtgggttgtggtgagggtagtgggtaaagaagcgccggctaactacgtgccagcagccgcggtaatacgtagggcgcgagcgttgtccggaattattgggcg
taaagagcttgtaggcggtttgtcgcgtctgctgtgaaaggccggggcttaaccccgtgtattgcagtgggtacgggcagactagagtgcagtaggggagactggaattcctggtgtagcggtggaatgcgcagatatcaggaagaacaccgatggcgaaggcaggttactgggccgttactgacgctgaggagcgaaagcgtggggagcgaacaggattagataccccggtagtc
18.》otu568
19.cctacgggtggcagcagtgaggaatattggtcaatggacggaagtctgaaccagccaagtagcgtgcaggatgacggccctatgggttgtaaactgcttttgtatggggataaagttagggacgtgtccctatttgcaggtaccatacgaataaggaccggctaattccgtgccagcagccgcggtaatacgtagggtgcgagcgttaatcggaattactgggcgtaaagcgagcgcagacggttacttaagcaggatgtgaaatccccgggctcaacctgggaactgcgttctgaactgggtgactagagtgtgtcagagggaggtagaattccaggtgtagcggtgaaatgcgtagagatctggaggaataccgatggcgaaggcagcttcctggcatcatactgacactgaggttcgaaagcgtgggtagcaaacaggattagataccccagtagtc
20.》otu1143
21.ccacggggggctgcagtggggaatattggacaatggggggaaccctgatccagccatgccgcgtgagtgaagaaggttttcggatcgtaaagctctgttgtaagagaagaacgagtgtgagagtggaaagttcacactgtgacggtatcttaccagaaagggacggctaactacgtgccagcagccgcggtaatacggaggtcccgagcgttgtccggatttattgggcgtaaagcgagcgcaggcggttagataagtctgaagttaaaggctgtggcttaaccatagtacgctttggaaactgtttaacttgagtgcagaaggggagagtggaattccatgtgtagcggtgaaatgcgtagatatatggaggaacaccggtggcgaaagcggctctctggtctgtaactgacgctgaggctcgaaagcgtggggagcaaacaggattagataccctgtagtc
22.》otu1389
23.cctacgggtggcagcagtggggaatattgcacaatgggcgcaagcctgatgcagcgacgccgcgtgagggatgacggccttcgggttgtaaacctctgttagcagggaagaagagagattgacggtacctgcagagaaagcgccggctaactacgtgccagcagccgcggtaatacgtagggcgcgagcgttgtccggatttactgggtgtaaagggagcgcagacggttgcgcaagtctgaagtgaaatcccgaggcttaaccacgggactgctttggaaactgtgcgacttgagtatcggaggggcaggcggaattcctagtgtagcggtgaaatgcgtagatattaggaggaacaccagtggcgaaggcgactttctggaagataactgacgttgaggctcgaaggcgtgggtagcaaacaggattagataccccagtagtc
24.另外本发明还提供了一种检测试剂,包括用于检测seq id no:1-9所示的9种微生物基因的引物。所述引物序列为seq id no:10-11,引物序列如下:
25.引物primers
26.测序区域v3+v4:338f-806r
27.上游引物:338f actcctacgggaggcagca
28.下游引物:806r ggactachvgggtwtctaat
29.本发明还提供了检测试剂在制备预测新冠肺炎患者一年后中和抗体水平的口腔微生物检测模型中的应用,所述检测试剂适用于检测seq id no:1-9所示的9种微生物基因。
30.本发明还提供了构建一种预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型中的应用,所述检测试剂适用于检测seq id no:1-9所示的9种微生物基因。
31.所述微生物预测模型适用于预测新冠肺炎患者一年后中和抗体水平。
32.对所述对象的舌苔进行检测,以便确定该样本是否包含所述的微生物基因,是否可以建立预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型。
33.所述微生物预测模型适用于预测新冠肺炎患者一年后中和抗体水平。
34.对所述对象的舌苔进行检测,以便确定该样本是否包含所述的微生物基因,是否可以建立预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型。
35.通过收集入组对象的舌苔样本,抽提微生物总dna,完成微生物dna的16s rdna miseq测序,检测是否存在权利要求1所述的9种微生物基因。
36.进一步的,通过收集入组对象的舌苔样本,抽提微生物总dna,进行口腔菌群的16s rdna miseq测序。基于高通量测序数据,建立新冠肺炎患者一年后中和抗体水平的口腔微生物预测模型,建立新冠肺炎患者一年后中和抗体抑制率低于70%的患病率(probability of disease,pod)指数;pod指数可用于计算其预测能力。
37.具体包括:
38.(1)收集入组对象(治愈出院的新冠肺炎患者)的舌苔样本,按照dna的标准抽提方法完成舌苔样本中微生物总dna的抽提,在illumina miseq平台完成口腔菌群的16s rdna高通量测序工作;
39.(2)基于高通量测序数据,在微生物预测模型的队列中,在7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者之间,基于一个随机森林模型,通过一个五倍交叉验证的算法,鉴定了用于该模型的最佳的9个微生物基因标志物;
40.(3)基于9个微生物基因标志物,通过使用随机生成的决策树的比率来计算一年后中和抗体抑制率低于70%的患病率(probability of disease,pod)指数;
41.(4)该微生物区别模型在7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者之间的预测能力达到84.13%,pod指数在一年后中和抗体抑制率低于70%的新冠肺炎患者中明显升高,两组之间有显著性差异(p<0.05)。
42.因此,本发明的微生物基因预测模型在一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者中实现了良好的预测能力。
43.另外,还提供了一种用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型的试剂盒,包括用于检测权利要求1所述的seq id no:1-9所示的9种微生物基因的引物。
44.本发明的具体操作步骤如下:
45.(1)按照前瞻性临床试验的设计原则,本发明的研究设计如图1所示。该研究方案得到了郑州大学第一附属医院伦理委员会的批准。所有入组的患者签署研究方案知情同意书和临床样本收集知情同意书。
46.(2)每一个入组的新冠肺炎治愈者在出院时提供一份新鲜的舌苔样本,并立即冻存于-80℃冰箱。舌苔细菌总dna的抽提方法按照试剂盒的说明书进行。
47.(3)完成舌苔细菌总dna样本的扩增和dna文库构建,在illuminamiseq测序平台完成16s rdna测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
48.(4)从所有样本中随机抽选等量的序列数,按照uparse传递途径拼接成对应的16s rdna基因序列分类单元(operational taxonomy units,otus),将产生的所有样本的otus基因序列收集整理。基于微生物基因序列,使用rdp分类器2.6版本注释。
49.(5)基于高通量测序数据产生的代表性序列,计算出微生物基因标志物的otus频率文件。这些otus用于一个相关性研究来鉴定在一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者之间的otus丰度。使用wilcoxon检验方法统计分析一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者之间差异的微生物基因标志物。
50.(6)在微生物预测模型中,包括7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者,使用筛选出的otus丰度文件,在一个随机森林模型(r软件3.4.1和随机森林软件包4.6
–
12)中采用五倍交叉验证的算法(除了设置“importance=true”之外,软件参数默认)进行微生物基因标志物的筛选。采用五倍交叉验证的5次试验,获得了交叉验证错误曲线,其中最小的交叉验证错误点作为cut-off值使用。最小的交叉验证错误值加上对应值的标准差为cut-off值。筛选出小于cut-off值的错误率的9个以下的otus标志物的集合,选择最小数目otus的集合作为最佳的微生物基因标志物的集合,最终鉴定了用于该模型的最佳的9个微生物基因标志物(图2)。选择出的9个微生物otus标志物的基因序列见seq id no:1-9。
51.(7)通过使用随机生成的决策树的比率来计算患病率(probability of disease,pod)指数。决策树预测样本为“covid-19-l”,设置的参数预测为:proximity=t,norm.votes=t,predict.all=true。在loo模式中构建的随机森林模型用于预测队列中每一个样本的pod指数,最终计算每一个样本的平均预测的pod指数。
52.(8)使用r 3.3.0程序包中的proc工具计算受试者工作曲线(roc),用来评估微生物预测模型,曲线下面积(auc)用于指定roc的效应值。
53.(9)该微生物区别模型在7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者之间的区别能力达到84.13%(图3),pod指数在一年后中和抗体抑制率低于70%的新冠肺炎患者中明显升高,两组之间有显著性差异(p<0.05)(图4)。
54.因此,本发明的微生物基因预测模型在一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者中实现了良好的预测能力。
附图说明
55.图1.一种用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型及其应用。
56.图2.基于随机森林模型采用五倍交叉验证法鉴定的最佳的口腔微生物基因标志物。
57.图3.在7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者的队列中,患病率(pod)指数在两组之间的表达差异;
58.图4.在7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者之间的队列中,微生物基因预测模型实现的预测效能。
具体实施方式
59.下面结合实施例对本发明作进一步的阐述,但本发明的保护内容不仅限于这些实
施例。
60.下列实施例中所用方法如无特别说明,均为常规方法。下列实施例中所需要的材料或试剂,如无特殊说明均为公开商业途径获得。
61.本发明通过收集入组对象的舌苔样本,抽提微生物总dna,进行口腔菌群的16s rdna miseq测序。基于高通量测序数据,在建立新冠肺炎患者一年后中和抗体水平的口腔微生物预测模型,建立一年后中和抗体抑制率低于70%的患病率(probability of disease,pod)指数;pod指数可用于计算其预测能力。
62.其操作步骤如下:
63.(1)按照前瞻性临床试验的设计原则,本发明的研究设计如图1所示。该研究方案得到了郑州大学第一附属医院伦理委员会的批准。所有入组的患者签署研究方案知情同意书和临床样本收集知情同意书。
64.(2)每一个入组的新冠肺炎治愈者在出院时提供一份新鲜的舌苔样本,并立即冻存于-80℃冰箱。舌苔细菌总dna的抽提方法按照试剂盒的说明书进行。
65.(3)完成舌苔细菌总dna样本的扩增和dna文库构建,在illuminamiseq测序平台完成16s rdna测序。所有的输出序列完成基本的预处理和基本的生物信息学分析。
66.(4)从所有样本中随机抽选等量的序列数,按照uparse传递途径拼接成对应的16s rdna基因序列分类单元(operational taxonomy units,otus),将产生的所有样本的otus基因序列收集整理。基于微生物基因序列,使用rdp分类器2.6版本注释。
67.(5)基于高通量测序数据产生的代表性序列,计算出微生物基因标志物的otus频率文件。这些otus用于一个相关性研究来鉴定在一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者之间的otus丰度。使用wilcoxon检验方法统计分析一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者之间差异的微生物基因标志物。
68.(6)在微生物预测模型中,包括7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者,使用筛选出的otus丰度文件,在一个随机森林模型(r软件3.4.1和随机森林软件包4.6
–
12)中采用五倍交叉验证的算法(除了设置“importance=true”之外,软件参数默认)进行微生物基因标志物的筛选。采用五倍交叉验证的5次试验,获得了交叉验证错误曲线,其中最小的交叉验证错误点作为cut-off值使用。最小的交叉验证错误值加上对应值的标准差为cut-off值。筛选出小于cut-off值的错误率的9个以下的otus标志物的集合,选择最小数目otus的集合作为最佳的微生物基因标志物的集合,最终鉴定了用于该模型的最佳的9个微生物基因标志物(图2)。选择出的9个微生物otus标志物的基因序列见seq id no:1-9。
69.(7)通过使用随机生成的决策树的比率来计算患病率(probability of disease,pod)指数。决策树预测样本为“cpr0-l”,设置的参数预测为:proximity=t,norm.votes=t,predict.all=true。在loo模式中构建的随机森林模型用于预测队列中每一个样本的pod指数,最终计算每一个样本的平均预测的pod指数。
70.(8)使用r 3.3.0程序包中的proc工具计算受试者工作曲线(roc),用来评估微生物预测模型,曲线下面积(auc)用于指定roc的效应值。
71.(9)该微生物区别模型在7例一年后中和抗体抑制率高于70%和9例一年后中和抗
体抑制率低于70%的新冠肺炎患者之间的区别能力达到84.13%(图3),pod指数在一年后中和抗体抑制率低于70%的新冠肺炎患者中明显升高,两组之间有显著性差异(p<0.05)(图4)。
72.因此,本发明的微生物基因预测模型在一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者中实现了良好的预测能力。
技术特征:1.一种预测新冠肺炎患者一年后中和抗体水平的口腔微生物基因标志物,其特征在于:由seq id no:1-9所示的9种微生物基因组成。2.一种用于检测权利要求1所述口腔微生物基因标志物的检测试剂,包括用于检测权利要求1所述的seq id no:1-9所示的9种微生物基因的引物。3.根据权利要求2所述的检测试剂,其特征在于:所述引物序列为seq id no:10-11。4.权利要求2或3所述检测试剂在制备新冠肺炎患者一年后中和抗体水平预测的检测试剂盒中的应用,所述检测试剂适用于检测权利要求1所述的口腔微生物基因。5.根据权利要求4所述的应用,其特征在于:通过收集入组对象的舌苔样本,抽提微生物总dna,完成微生物dna的16s rdna miseq测序,检测是否存在权利要求1所述的9种微生物基因。6.根据权利要求5所述的应用,其特征在于:通过收集入组对象的舌苔样本,抽提微生物总dna,进行口腔菌群的16s rdna miseq测序;基于高通量测序数据,在队列中建立新冠肺炎患者一年后中和抗体水平的口腔微生物预测模型,建立一年后中和抗体抑制率低于70%的患病率pod指数;pod指数可用于计算其预测能力。7.根据权利要求4所述的应用,其特征在于,具体包括:(1)收集入组对象的舌苔样本,按照dna的标准抽提方法完成舌苔样本中微生物总dna的抽提,在illumina miseq平台完成口腔菌群的16s rdna高通量测序工作;(2)基于高通量测序数据,在微生物预测模型的队列中,在7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者之间,基于一个随机森林模型,通过一个五倍交叉验证的算法,鉴定了用于该模型的最佳的9个微生物基因标志物;(3)基于9个微生物基因标志物,通过使用随机生成的决策树的比率来计算一年后中和抗体抑制率低于70%的患病率pod指数;(4)该微生物区别模型在7例一年后中和抗体抑制率高于70%和9例一年后中和抗体抑制率低于70%的新冠肺炎患者之间的预测能力达到84.13%,pod指数在一年后中和抗体抑制率低于70%的新冠肺炎患者中明显升高,两组之间有显著性差异。8.一种用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型的试剂盒,包括用于检测权利要求1所述的seq id no:1-9所示的9种微生物基因的引物。9.权利要求1所述口腔微生物基因标志物在构建预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型中的应用。10.一种预测新冠肺炎患者一年后中和抗体水平的口腔微生物模型,包括seq id no:1-9所示的9种微生物基因。
技术总结本发明属于生物医药技术领域,具体涉及一种用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物基因标志物及其应用。本发明提供了一种用于预测新冠肺炎患者一年后中和抗体水平的口腔微生物基因标志物,由SEQ ID NO:1-9所示的9种微生物基因组成。本发明的微生物基因预测模型在一年后中和抗体抑制率高于70%和一年后中和抗体抑制率低于70%的新冠肺炎患者中实现了良好的预测能力。患者中实现了良好的预测能力。患者中实现了良好的预测能力。
技术研发人员:任志刚 饶本臣 余博
受保护的技术使用者:郑州大学第一附属医院
技术研发日:2022.04.11
技术公布日:2022/7/5