本申请涉及医学与人工智能技术交叉领域,特别是涉及一种临床疗效特征增强方法及相关设备。
背景技术:
1、确认医疗方案对于特定病症的治疗效果极为关键,它有助于提高医疗品质、维护患者利益,并促进医学科学的进步。目前,评估治疗方案的效果主要通过临床试验和临床实践来实现,这包括对患者进行长期观察,并收集治疗前后的各种医疗数据,例如症状的改善、生活质量的变化、生物标志物的变动和长期生存情况等。通过随机对照试验和观察性研究,医疗专业人员能够评价不同治疗方案的疗效,并鉴定出对特定病症最有效的治疗方案。
2、随着人工智能技术的不断进步,越来越多的医疗专业人员开始探索使用人工智能技术来评估治疗方案的疗效。例如,他们可能会使用临床数据样本来训练人工智能模型,然后用这个模型来预测治疗效果。与传统的疗效评估方法相比,人工智能技术能实现更高的评估效率和准确性。然而,在实际应用中,常常遇到临床样本收集成本高、样本数量不足、数据质量不佳等问题,训练模型时缺乏大量、优质的临床样本的支撑,容易导致训练好的模型表现不佳。
技术实现思路
1、本申请针对上述不足或缺点,提供了一种能够高效生成大量、优质的临床疗效特征数据的临床疗效特征增强方法及相关设备。
2、本申请根据第一方面提供了一种临床疗效特征增强方法,在一些实施例中,该方法包括:
3、采集多个患有特定疾病且采用特定治疗方案进行治疗的患者的临床数据;
4、对每个患者的临床数据中的非结构化数据进行结构化处理,得到每个患者的结构化诊疗信息;
5、从每个患者的结构化诊疗信息中提取预先确定的与特定治疗方案的临床疗效相关的特征的特征值作为临床疗效特征数据;
6、基于提取的临床疗效特征数据构建种子数据集,使用临床疗效预测模型和特征增强模型,以种子数据集为基础进行特征增强处理,得到特征增强数据集。
7、在一些实施例中,特征增强处理包括多次特征数据生成操作,特征数据生成操作包括:
8、使用训练数据集对临床疗效预测模型进行微调,其中,当本次特征数据生成操作是首次进行时,以种子数据集作为训练数据集,当本次特征数据生成操作不是首次进行时,以上一次进行特征数据生成操作所得到的增强数据集作为训练数据集;
9、使用种子数据集评估微调后的临床疗效预测模型并从种子数据集中提取微调后的临床疗效预测模型预测错误的临床疗效特征数据作为错误数据集;
10、使用特征增强模型以错误数据集为基础生成新的临床疗效特征数据;
11、将新的临床疗效特征数据添加到训练数据集中得到增强数据集;
12、特征增强数据集是进行最后一次特征数据生成操作所得到的增强数据集。
13、在一些实施例中,每个患者的临床数据包括中医临床数据和/或西医临床数据;
14、对每个患者的临床数据中的非结构化数据进行结构化处理,包括:
15、使用预先训练好的大语言模型从每个患者的中医临床数据和/或西医临床数据中的文本类描述数据中提取关键元素及其对应的元素信息,基于提取的关键元素及其对应的元素信息构建关键元素键值对。
16、在一些实施例中,临床疗效预测模型是预先在疾病诊疗相关的大型结构化数据集上进行了预训练的大语言模型;特征增强模型是预先训练好的用于基于已有的临床疗效特征数据生成新的临床疗效特征数据的大语言模型。
17、在一些实施例中,特定疾病为高炎症急性心肌梗死,特定治疗方案包括包含痰火方的中西医结合治疗方案;
18、与包含痰火方的中西医结合治疗方案的临床疗效相关的特征包括炎症指标和心功能指标;炎症指标包括白细胞总数、中性粒细胞数、超敏c反应蛋白和白细胞介素6;心功能指标包括左心房内径、左心室内径、射血分数、nt-pro bnp和主要不良心脏事件。
19、在一些实施例中,确定与包含痰火方的中西医结合治疗方案的临床疗效相关的特征的操作,包括:
20、将指定医院内的符合纳入标准且不符合排除标准的患者确定为受试者,以随机分配的方式将确定的受试者分为痰火方治疗组和对照组;
21、采集每个受试者的临床数据;每个受试者的临床数据包括观察数据、主要终点和次要终点;
22、对每个受试者的临床数据中的非结构化数据进行结构化处理,得到每个受试者的结构化诊疗信息;
23、根据痰火方治疗组和对照组中的受试者的结构化诊疗信息进行统计分析,基于统计分析结果确定与包含痰火方的中西医结合治疗方案的临床疗效相关的特征。
24、在一些实施例中,观察数据包括住院期间基线数据、指定时间节点的指定指标信息、心脏超声数据和主要不良心脏事件发生率;指定时间节点包括服药7天后和出院1个月;指定指标信息包括白细胞和中性粒细胞变化信息、超敏c反应蛋白指标值和白细胞介素6指标值;主要终点包括指定时间节点的指定指标信息、出院1个月的心脏超声左心室舒张末内径和射血分数变化信息;次要终点包括出院后1个月主要不良心脏事件发生率。
25、本申请根据第二方面提供了一种临床疗效特征增强装置,在一些实施例中,该装置包括:
26、数据采集模块,用于采集多个患有特定疾病且采用特定治疗方案进行治疗的患者的临床数据;
27、结构化处理模块,用于对每个患者的临床数据中的非结构化数据进行结构化处理,得到每个患者的结构化诊疗信息;
28、特征提取模块,用于从每个患者的结构化诊疗信息中提取预先确定的与特定治疗方案的临床疗效相关的特征的特征值作为临床疗效特征数据;
29、特征增强模块,用于基于提取的临床疗效特征数据构建种子数据集,使用临床疗效预测模型和特征增强模型,以种子数据集为基础进行特征增强处理,得到特征增强数据集。
30、本申请根据第三方面提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述任一实施例中提供的临床疗效特征增强方法的步骤。
31、本申请根据第四方面提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述任一实施例中提供的临床疗效特征增强方法的步骤。
32、针对临床样本收集成本高、样本数量不足、数据质量不佳等问题,本申请的上述实施例,以种子数据集为基础,通过两个人工智能模型连续进行对抗实现不断基于真实的临床疗效特征数据生成新的临床疗效特征数据,实现特征增强效果,如此能够快速低成本地生成大量、优质的临床疗效特征数据。
1.一种临床疗效特征增强方法,其特征在于,所述方法包括:
2.如权利要求1所述的方法,其特征在于,所述特征增强处理包括多次特征数据生成操作,所述特征数据生成操作包括:
3.如权利要求1所述的方法,其特征在于,每个所述患者的临床数据包括中医临床数据和/或西医临床数据;
4.如权利要求1所述的方法,其特征在于,所述临床疗效预测模型是预先在疾病诊疗相关的大型结构化数据集上进行了预训练的大语言模型;所述特征增强模型是预先训练好的用于基于已有的临床疗效特征数据生成新的临床疗效特征数据的大语言模型。
5.如权利要求1-4中任一项所述的方法,其特征在于,所述特定疾病为高炎症急性心肌梗死,所述特定治疗方案包括包含痰火方的中西医结合治疗方案;
6.如权利要求5所述的方法,其特征在于,确定与所述包含痰火方的中西医结合治疗方案的临床疗效相关的特征的操作,包括:
7.如权利要求6所述的方法,其特征在于,所述观察数据包括住院期间基线数据、指定时间节点的指定指标信息、心脏超声数据和主要不良心脏事件发生率;所述指定时间节点包括服药7天后和出院1个月;所述指定指标信息包括白细胞和中性粒细胞变化信息、超敏c反应蛋白指标值和白细胞介素6指标值;主要终点包括指定时间节点的指定指标信息、出院1个月的心脏超声左心室舒张末内径和射血分数变化信息;次要终点包括出院后1个月主要不良心脏事件发生率。
8.一种临床疗效特征增强装置,其特征在于,所述装置包括:
9.一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。