1.本技术涉及人工智能技术领域,具体涉及一种续保行为预测模型的联合训练方法、装置及电子设备。
背景技术:2.随着大数据和人工智能的发展,精准营销模型也得到广泛第应用。在保险行业中,对于一些转化、留存场景中,由于整个转化期较长,转化期间客户特征分布、特征与目标变量的联合分布可能会发生较大变化。为了能得到更好的预测精度,一种可行的方法是选取几个典型的观察点,基于不同的观察点构建数据集,分别建立模型。但这种方法存在很多不足之处,如由于基于不同的观察点独立建模,对于一些客户特征变化不大的样本,几个模型可能会预测出偏差较大的结果;如果不加后处理,几个模型的预测概率空间未对齐到统一的量纲;且各模型也未利用到其他模型学习到的“知识”相互协同、辅助训练。
技术实现要素:3.本技术实施例针对上述情况,提出了一种续保行为预测模型的联合训练方法、装置及电子设备,采用跨时点联合建模的方法,借鉴知识蒸馏的思想,在联合训练网络的最终损失函数中,引入一致性损失,促使模型相互学习,提升最终的模型精度。
4.第一方面,本技术实施例提供了一种续保行为预测模型的联合训练方法,包括:
5.构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;
6.构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;
7.将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
8.第二方面,本技术实施例还提供了一种续保行为预测模型的联合训练装置,包括:
9.模型构建单元,用于构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;
10.样本构建单元,用于构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;
11.训练单元,用于将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
12.第三方面,本技术实施例还提供了一种电子设备,包括:处理器;以及被安排成存
储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行上述任一的方法。
13.第四方面,本技术实施例还提供了一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行上述任一的方法。
14.本技术实施例采用的上述至少一个技术方案能够达到以下有益效果:
15.本技术通过构建续保行为预测模型的联合训练网络以及训练用样本集,在联合训练网络中包括多个续保行为预测模型,每个续保行为预测模型对应一个指定时间节点,并且设计了一致性损失函数,各续保行为预测模型的损失函数与该一致性损失函数共同构成了联合训练网络的整体损失函数,以该整体损失函数为基准,作为调整续保行为预测模型的参数调整的基础,采用训练用样本集对续保行为预测模型联合训练网络进行整体训练,得到各个指定时间节点的续保行为预测模型。本技术借鉴知识蒸馏的思想,采用跨时点联合建模的方法,利用各观察点续保行为预测模型学习到的“知识”相互协同、辅助训练,提高各观察点续保行为预测模型的精度,从而实现了对于一些客户特征变化不大的样本,模型也可以输出较为一致的预测;采用联合训练方法,不同时间节点的续保行为预测模型的预测概率空间对齐,便于业务相互比较,制定营销策略。
附图说明
16.此处所说明的附图用来提供对本技术的进一步理解,构成本技术的一部分,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
17.图1示出根据本技术的一个实施例的续保行为预测模型的联合训练方法的流程示意图;
18.图2示出根据本技术的另一个实施例的续保行为预测模型的联合训练网络的结构示意图;
19.图3示出根据本技术的一个实施例的续保行为预测模型的联合训练装置的结构示意图;
20.图4为本技术实施例中一种电子设备的结构示意图。
具体实施方式
21.为使本技术的目的、技术方案和优点更加清楚,下面将结合本技术具体实施例及相应的附图对本技术技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
22.以下结合附图,详细说明本技术各实施例提供的技术方案。
23.本技术的构思在于,采用跨时点联合建模的方法,借鉴知识蒸馏的思想,对于同一客户,在最终的损失函数引入一致性损失,促使模型相互学习,提升最终的模型精度。
24.图1示出了本技术根据本技术的一个实施例的续保行为预测模型的联合训练方法的流程示意图,从图1可以看出,本技术至少包括步骤s110~步骤s130:
25.步骤s110:构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个
续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的。
26.随着保险业务的普及,越来越多的个人或公司选择购买保险产品,以给未来的不确定性提供更多的保障。对于保险公司来说,在保用户(已经购买保险产品的用户)在购买的保险产品到期后,会期望在保用户进行续保,即使在保用户有不续保的意愿,保险公司也希望通过对该用户进行行为干预以使其能够续保。
27.比如对于医疗险而言,医疗险是一年一续保的,保险产品到期后,该保险失效,用户进行续保,保险公司才会为用户提供下一年的保险服务。对于保险公司而言,是希望用户年年能够如期续保的。通常情况下,续保行为在保险到期前后一段时间内进行续保,保险都是有效的,但是为了提高用户的转化和留存,保险公司会在保险产品到期之前的一段时间提醒用户续保,但是仍然有一部分用户不进行续保,这时保险公司相对这部分不续保用户的行为进行干预,尤其是对本身有一定续保意愿的用户,因此准确预测用户的续保行为或者意愿对保险公司具有很大的意义。
28.由于保险的特殊性,将潜在用户转化为成交用户,或者将在保用户进行留存这一过程的时间周期是较长的,比如3-4个月,甚至半年。在这个转化期间中,客户特征分布、特征与目标变量的联合分布可能会发生较大变化。现有技术中,为了能达到更好的预测精度,通过选取几个(通常为2个)典型的时间观察点,如保险到期前60天、前30天等;基于不同的观察点构建样本数据集,建立不同时间观察点的预测模型,然后对构建的不同时间节点的模型分别训练,得到的同时间观察点的预测模型,这些模型用于在不同的时间点,对还未转化的用户的行为进行预测。
29.但这种方法存在很多弊端,如由于基于不同的观察点独立建模,对于一些客户特征变化不大的样本,几个模型可能会预测出偏差较大的结果;且几个模型的预测概率空间未对齐到统一的量纲,比如一个模型预测的是续保的行为的概率为80%,另一个模型预测的续保的行为的概率为60%,但是由于不同的模型之间量纲不同,80%和60%之间是不具有比较性的;另外各模型利用到的“知识”比较孤立,模型预测的准确度较低。
30.对此,本技术采用跨时点联合建模的方法,借鉴知识蒸馏的思想,通过约束各时点模型预测结果分布的一致性,让模型学习到的知识可以相互迁移。在最终的损失函数中,不仅考虑每个时间节点的模型单独训练时所使用的损失函数,还引入一致性损失,促使模型相互学习,提升最终的模型精度。
31.具体的,首先,构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,每个续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各所述续保行为预测模型的损失函数与一致性损失函数共同构建的,采用指定的参数(式1中的α)来调节一致性损失函数的权重。
32.以续保行为预测模型为两个为例,图2示出了根据本技术的一个实施例的续保行为预测模型的联合训练网络的结构示意图,从图2可以看出,联合训练网络200包括第一时间节点的续保行为预测模型,记为t1模型210,和第二时间节点的续保行为预测模型,记为t2模型220,t1模型210和t2模型220的损失函数与一致性损失函数一同构成了续保行为预测模型的联合训练网络200的损失函数。其中,t1模型210和t2模型220对应着不同的指定时间节点,比如t1模型210对应保单到期前60天,t2模型220对应保单到期时。想要将得到续保
行为预测模型用于预测用户何时的行为,就将指定时间节点指定为何时即可。
33.在本技术的一些实施例中,一致性损失函数是基于一致性损失函数的权重以及温度超参数等确定的,该损失函数设计的构思在于:借鉴知识蒸馏的思想,通过约束各时点模型预测结果分布的一致性,让模型学习到的知识可以相互迁移。
34.步骤s120:构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注。
35.在构建训练样本集时,需要收集到的客户在多个指定时间节点的数据及标注,其中的多个指定时间节点与前述步骤s110中的指定时间节点是一一对应的。
36.假设将该样本中的客户记为客户a,假设指定时间节点,即观察点有2个,其中一个是保单到期时,另一个是保单到期前60天。在构建训练样本集时,分别获取客户a在保单到期前60天的数据,记为x1,以及对应的标注y1;获取客户a在保单到期时的数据,记为x2,以及对应的标注y2,对于一个训练样本可记为(x1,x2)-》(y1,y2)。需要说明的是,对于不同的客户来说,分别以客户各自的保单的到期时间为基准,比如说,客户a的保单是4.1号到期,那收集的数据分别为4.1号向前推算60天,以及4.1号这两个时间点的数据;而对于客户b来说,其保单到期是7.1号,那收集数据分别为7.1号向前推算60天,以及7.1号这两个时间点的数据,即每个样本都以其保单到期为基准,互相不影响。
37.其中,在本技术的一些实施例中,续保行为预测模型为二分类模型,y1和y2的具体值为0或1,0表示不进行续保,1表示进行续保。多个样本就组成训练样本集,在本技术中,对训练样本集中样本的数量不做限制,通常有几万条样本即可达到较好的训练效果,训练样本越多越好,如几十万条样本。
38.步骤s130:将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
39.通过构建得到续保行为预测模型的联合训练网络后和训练用样本集后,即可将训练样本集输入续保行为预测模型的联合训练网络进行联合训练,即可得到各指定时间节点的续保行为预测模型。
40.训练的过程是不断迭代的过程,一个轮次的训练过程结束后,根据该轮次的训练过程得到的整体损失函数的结果,对整体网络中的各个模型的参数进行调整,然后将更新后的模型参数用于下一轮次的训练,直到达到预设的训练要求,如预设的训练要求为迭代20000次,则当达到这个迭代次数后,整个训练过程结束,即得到最终的各个时间节点的续保行为预测模型。
41.本技术通过一次训练,可以得到多个续保行为预测模型,每一个续保行为预测模型对应一个指定时间节点。在进行预测时,基于不同的观察点,使用对应的模型与对应观察点的用户数据,来预测客户的转化概率。
42.由图1所示的方法可以看出,本技术构建续保行为预测模型的联合训练网络以及训练用样本集,在联合训练网络中包括多个续保行为预测模型,每个续保行为预测模型对应一个指定时间节点,并且设计了一致性损失函数,各续保行为预测模型的损失函数与该一致性损失函数共同构成了联合训练网络的整体损失函数,以该整体损失函数为基准,作为调整续保行为预测模型的参数调整的基础,采用训练用样本集对续保行为预测模型联合
训练网络进行整体训练,得到各个指定时间节点的续保行为预测模型。本技术借鉴知识蒸馏的思想,采用跨时点联合建模的方法,利用各观察点续保行为预测模型学习到的“知识”相互协同、辅助训练,提高各观察点续保行为预测模型的精度,从而实现了对于一些客户特征变化不大的样本,模型也可以输出较为一致的预测;采用联合训练方法,不同时间节点的续保行为预测模型的预测概率空间对齐,便于业务相互比较,制定营销策略。
43.在本技术的一些实施例中,在上述方法中,所述指定时间节点的数量为多个,所述整体损失函数l(θ)为:
[0044][0045]
其中,
[0046]
若各所述续保行为预测模型为二分类模型,则若各所述续保行为预测模型为多分类模型,则
[0047]
表征各所述续保行为预测模型的损失;
[0048]
n表示训练样本数,α表示一致性损失函数的权重,t表示温度超参数,表示当前样本是否属于该任务,表示样本xj的本真值,为各续保行为预测模型的输出内容。
[0049]
需要说明的是,在实际场景中,二分类模型使用的场景是比较广泛的,因此,通常情况下
[0050]
其中,若指定时间节点的数量为两个,则所述整体损失函数l(θ)为:
[0051][0052]
其中,
[0053][0054]
分别表示样本x1,x2的本真值,为各续保行为预测模型的输出内容,其他参数同上。
[0055]
在本技术的一些实施例中,在上述方法中,所述多个指定时间节点包括:保单到期时间、保单到期前第一指定时长、保单到期后第二指定时长。
[0056]
在本技术的一些实施例中,在上述方法中,所述构建续保行为预测模型的联合训练网络,包括:确定多个指定时间节点;根据指定时间节点的数量,确定续保行为预测模型的数量,以及所述整体损失函数的表达式,形成续保行为预测模型的联合训练网络。
[0057]
也就是说,想要将模型用于预测用户在什么时间节点的行为,就将制定时间节点设置在什么时候,想要预测几个时间节点的行为,就设置多少个续保行为预测模型。通常续
保行为发生在保单到期前后一段时间,保单都是有效的,因此,这段时间是对用户行为预测和干预的高发期,如保单到期前60d,以及保单到期后60d。因此,可将指定时间节点设置在保单到期时间、保单到期前第一指定时长、保单到期后第二指定时长,得到的多个续保行为预测模型能够分别用来预测用户在保单到期前第一指定时长、保单到期时间和保单到期后第二指定时长的行为,满足应用需求。
[0058]
在本技术的一些实施例中,在上述的方法中,各续保行为预测模型的结构是相同的,各续保行为预测模型的结构分别包括:embedding层连接mlp(多层感知器)模型。但并不限于此,可更加具体的场景特点决定合适的模型结构。
[0059]
其中,embedding层用来对训练样本转化为输入向量,多层感知机(mlp,multilayer perceptron)也叫人工神经网络(ann,artificial neural network),除了输入输出层,它中间可以有多个隐层,最简单的mlp只含一个隐层,即三层的结构,多层感知机层与层之间是全连接的。多层感知机最底层是输入层,中间是隐藏层,最后是输出层。可以直接引用现有技术中的mlp模型,也可以根据需求,对其进行改造,对此本技术不作限制。
[0060]
在本技术的一些实施例中,在上述方法中,所述构建训练样本集包括:对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,并根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注;循环执行所述对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,并根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注的步骤,直到得到指定数量的训练样本,构成所述训练样本集。
[0061]
在训练阶段,构造样本是选取应续期(在这期间,客户可以决定是否对这种保单续费)已经结束的保单,对于这些保单我们知道它是否已经续费,所以可以用来构造y标签;而对于特征,我们则是选取对应观察点之前的行为数据构造的。
[0062]
对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,其中用户信息包括但不限于身份、年龄、工作性质、收入情况;所述用户行为包括但不限于是否购买保险、购买保险险种、保费、保险额度等。根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注,简单的说,可以说身份、年龄、工作性质、收入情况、购买保险险种、保费、保险额度可以作为用户的用户数据,而是否购买保险可以用来对训练样本进行标注。
[0063]
在预测阶段,当保单满足对应的时间点时就使用对应的模型进行预测。在本技术的一些实施例中,在上述方法中,所述将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型,包括:在所述训练样本集中进行采样,得到目标训练样本;将目标训练样本分割为各指定时间节点对应的多个输入向量;将各指定时间节点的输入向量分别输入到对应的续保行为预测模型中;根据各续保行为预测模型的输出内容,确定所述整体损失函数的值;根据所述整体损失函数的值,更新各续保行为预测模型的参数。
[0064]
在申请的一些实施例中,每个训练样本中包括一个客户在不同的指定时间节点的特征数据,在进行训练时,将这些不通过指定时间节点的特征数据要输入到对应的模型中,假设样本a的数据包括第一指定时间节点的(x1,y1)和第二时间节点的(x2,y2),将第一指定时间节点的(x1,y1)记为第一输入向量,将第二时间节点的(x2,y2)记为第二输入向量,假设
第一指定时间节点与t1模型210(图2)对应,第二指定时间节点与t2模型220(图2),在训练时,将第一输入向量输入t1模型210,将第二输入向量输入t2模型220,然后使得t1模型210与t2模型220的输出内容进入整体损失函数,计算确定所述整体损失函数的值,根据所述整体损失函数的值,更新各续保行为预测模型的参数,这样一个轮次的训练即完成了。循环执行该上述步骤,直到达到预设的精度要求即可,就得到了各指定时间节点的续保行为预测模型。
[0065]
需要说明的是,通过一次联合训练,得到的是多个续保行为预测模型,每个模型对应一个时间节点,想要预测用户的那个时间节点的行为,就采用哪个模型,在训练完成后,预测过程中,各个续保行为预测模型是相互独立使用的。
[0066]
图3示出根据本技术的一个实施例的续保行为预测模型的联合训练装置的结构示意图,从图3可以看出,所述装置300包括:
[0067]
模型构建单元310,用于构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;
[0068]
样本构建单元320,用于构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;
[0069]
训练单元330,用于将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
[0070]
在本技术的一些实施例中,在上述装置中,所述指定时间节点的数量为多个,所述整体损失函数l(θ)为:
[0071][0072]
其中,
[0073]
若各所述续保行为预测模型为二分类模型,则若各所述续保行为预测模型为多分类模型,则
[0074]
表征各所述续保行为预测模型的损失;
[0075]
n表示训练样本数,α表示一致性损失函数的权重,t表示温度超参数,表示当前样本是否属于该任务,表示样本xj的本真值,为各续保行为预测模型的输出内容。
[0076]
在本技术的一些实施例中,在上述装置中,所述指定时间节点的数量为两个,所述整体损失函数l(θ)为:
[0077][0078]
其中,
[0079][0080]
分别表示样本x1,x2的本真值,为各续保行为预测模型的输出内容。
[0081]
在本技术的一些实施例中,在上述装置中,所述多个指定时间节点包括:保单到期时间、保单到期前第一指定时长、保单到期后第二指定时长;模型构建单元310,用于确定多个指定时间节点;根据指定时间节点的数量,确定续保行为预测模型的数量,以及所述整体损失函数的表达式,形成续保行为预测模型的联合训练网络。
[0082]
在本技术的一些实施例中,在上述装置中,样本构建单元320,用于对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,并根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注;循环执行所述对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,并根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注的步骤,直到得到指定数量的训练样本,构成所述训练样本集。
[0083]
在本技术的一些实施例中,在上述装置中,训练单元330,用于在所述训练样本集中进行采样,得到目标训练样本;将目标训练样本分割为各指定时间节点对应的多个输入向量;将各指定时间节点的输入向量分别输入到对应的续保行为预测模型中;根据各续保行为预测模型的输出内容,确定所述整体损失函数的值;根据所述整体损失函数的值,更新各续保行为预测模型的参数。
[0084]
在本技术的一些实施例中,在上述装置中,各所述续保行为预测模型的结构是相同的,各所述续保行为预测模型的结构分别包括:embedding层连接mlp模型。
[0085]
需要说明的是,上述的续保行为预测模型的联合训练装置能够一一实现前述的续保行为预测模型的联合训练方法,这里不再一一赘述。
[0086]
图4是本技术的一个实施例电子设备的结构示意图。请参考图4,在硬件层面,该电子设备包括处理器,可选地还包括内部总线、网络接口、存储器。其中,存储器可能包含内存,例如高速随机存取存储器(random-access memory,ram),也可能还包括非易失性存储器(non-volatile memory),例如至少1个磁盘存储器等。当然,该电子设备还可能包括其他业务所需要的硬件。
[0087]
处理器、网络接口和存储器可以通过内部总线相互连接,该内部总线可以是isa(industry standard architecture,工业标准体系结构)总线、pci(peripheral component interconnect,外设部件互连标准)总线或eisa(extended industry standard architecture,扩展工业标准结构)总线等。所述总线可以分为地址总线、数据总线、控制总线等。为便于表示,图4中仅用一个双向箭头表示,但并不表示仅有一根总线或一种类型的总线。
[0088]
存储器,用于存放程序。具体地,程序可以包括程序代码,所述程序代码包括计算机操作指令。存储器可以包括内存和非易失性存储器,并向处理器提供指令和数据。
[0089]
处理器从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成续保行为预测模型的联合训练装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:
[0090]
构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预
测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;
[0091]
构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;
[0092]
将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
[0093]
上述如本技术图3所示实施例揭示的续保行为预测模型的联合训练装置执行的方法可以应用于处理器中,或者由处理器实现。处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器,包括中央处理器(central processing unit,cpu)、网络处理器(network processor,np)等;还可以是数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
[0094]
该电子设备还可执行图3中续保行为预测模型的联合训练装置执行的方法,并实现续保行为预测模型的联合训练装置在图3所示实施例的功能,本技术实施例在此不再赘述。
[0095]
本技术实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的电子设备执行时,能够使该电子设备执行图3所示实施例中续保行为预测模型的联合训练装置执行的方法,并具体用于执行:
[0096]
构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;
[0097]
构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;
[0098]
将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。
[0099]
本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机
可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0100]
本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0101]
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0102]
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0103]
在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
[0104]
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。内存是计算机可读介质的示例。
[0105]
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
[0106]
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
[0107]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
[0108]
以上所述仅为本技术的实施例而已,并不用于限制本技术。对于本领域技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本技术的权利要求范围之内。
技术特征:1.一种续保行为预测模型的联合训练方法,其特征在于,包括:构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。2.根据权利要求1所述的方法,其特征在于,所述指定时间节点的数量为多个,所述整体损失函数l(θ)为:其中,若各所述续保行为预测模型为二分类模型,则若各所述续保行为预测模型为多分类模型,则模型为多分类模型,则表征各所述续保行为预测模型的损失;n表示训练样本数,α表示一致性损失函数的权重,t表示温度超参数,表示当前样本是否属于该任务,表示样本x
j
的本真值,为各续保行为预测模型的输出内容。3.根据权利要求2所述的方法,其特征在于,所述指定时间节点的数量为两个,所述整体损失函数l(θ)为:其中,其中,其中,分别表示样本x1,x2的本真值,为各续保行为预测模型的输出内容。4.根据权利要求1所述的方法,其特征在于,所述多个指定时间节点包括:保单到期时间、保单到期前第一指定时长、保单到期后第二指定时长;所述构建续保行为预测模型的联合训练网络,包括:确定多个指定时间节点;根据指定时间节点的数量,确定续保行为预测模型的数量,以及所述整体损失函数的表达式,形成续保行为预测模型的联合训练网络。
5.根据权利要求1所述的方法,其特征在于,所述构建训练样本集包括:对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,并根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注;循环执行所述对于一个训练样本,获取其在多个指定时间的用户信息和用户行为,并根据所述用户信息和所述用户行为,确定该用户在多个指定时间节点对应的用户数据以及对应的标注的步骤,直到得到指定数量的训练样本,构成所述训练样本集。6.根据权利要求1所述的方法,其特征在于,所述将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型,包括:在所述训练样本集中进行采样,得到目标训练样本;将目标训练样本分割为各指定时间节点对应的多个输入向量;将各指定时间节点的输入向量分别输入到对应的续保行为预测模型中;根据各续保行为预测模型的输出内容,确定所述整体损失函数的值;根据所述整体损失函数的值,更新各续保行为预测模型的参数。7.根据权利要求1~6中任一项所述的方法,其特征在于,各所述续保行为预测模型的结构是相同的,各所述续保行为预测模型的结构分别包括:embedding层连接mlp模型。8.一种续保行为预测模型的联合训练装置,其特征在于,包括:模型构建单元,用于构建续保行为预测模型的联合训练网络,所述联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点,其中,所述联合训练网络的整体损失函数是根据各续保行为预测模型的损失与一致性损失共同构建的;样本构建单元,用于构建训练样本集,所述训练样本集中任一样本包括一客户在多个指定时间节点对应的用户数据以及对应的标注;训练单元,用于将所述训练样本集输入所述联合训练网络进行训练,并根据所述整体损失函数的结果对各所述续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。9.一种电子设备,包括:处理器;以及被安排成存储计算机可执行指令的存储器,所述可执行指令在被执行时使所述处理器执行所述权利要求1~7所述方法。10.一种计算机可读存储介质,所述计算机可读存储介质存储一个或多个程序,所述一个或多个程序当被包括多个应用程序的电子设备执行时,使得所述电子设备执行所述权利要求1~7所述方法。
技术总结本申请公开了一种续保行为预测模型的联合训练方法、装置及电子设备,其方法包括:构建续保行为预测模型的联合训练网络,联合训练网络包括多个续保行为预测模型,各续保行为预测模型对应一个指定时间节点;构建训练样本集;将训练样本集输入联合训练网络进行训练,并根据整体损失函数的结果对各续保行为预测模型的参数进行调整,得到各指定时间节点对应的续保行为预测模型。本申请利用各观察点续保行为预测模型学习到的“知识”相互协同、辅助训练,提高各观察点续保行为预测模型的精度,且采用联合训练方法,不同时间节点的续保行为预测模型的预测概率空间对齐,便于业务相互比较,制定营销策略。定营销策略。定营销策略。
技术研发人员:刘齐
受保护的技术使用者:平安健康保险股份有限公司
技术研发日:2022.03.22
技术公布日:2022/7/5