本公开涉及计算机,尤其涉及一种信息确定方法、装置及介质。
背景技术:
1、随着推荐技术领域的发展,需要在多个场景下预测相同的任务,并根据任务预测结果进行相应的推荐。相关技术中,在面对多个场景下的任务预测的情况时,通常会针对每个场景构建一个模型,从而通过不同场景的模型确定相应场景下的任务预测结果,然而,这会导致线上模型过多,计算和维护成本高。因此,如何通过一个模型得到多个场景下的任务预测结果是亟需解决的技术问题。
技术实现思路
1、为克服相关技术中存在的问题,本公开提供一种信息确定方法、装置及介质。
2、根据本公开实施例的第一方面,提供一种信息确定方法,包括:
3、获取目标场景下的待推荐对象对应的特征信息,所述目标场景是多个场景中的任一个;
4、对所述特征信息进行编码处理,得到目标编码向量;
5、将目标编码向量输入训练完成的信息预测模型,所述信息预测模型包括定制门控网络、与多个所述场景对应的多个任务预测网络以及目标掩码网络,通过所述定制门控网络中的共享专家网络以及与多个所述场景对应的多个私有专家网络,输出与多个所述场景对应的多个目标特征向量;
6、根据多个所述任务预测网络对相应场景下的所述目标特征向量进行处理,得到所述待推荐对象在多个所述场景下的预设任务的任务预测结果;
7、根据所述目标掩码网络保留多个所述场景中的所述目标场景的目标任务预测结果,并过滤掉其他场景的其他任务预测结果,以及输出所述目标任务预测结果;
8、根据所述目标任务预测结果确定所述待推荐对象在所述目标场景下的推荐结果。
9、可选地,所述定制门控网络包括与多个所述场景对应的多个门控网络,所述通过所述定制门控网络中的共享专家网络以及与多个所述场景对应的多个私有专家网络,输出与多个所述场景对应的多个目标特征向量,包括:
10、通过多个所述私有专家网络和所述共享专家网络分别对所述目标编码向量进行处理,得到多个私有专家输出和共享专家输出,以及通过多个所述门控网络分别融合相应场景下的所述私有专家输出和所述目标编码向量、以及所述共享专家输出,输出多个所述目标特征向量。
11、可选地,所述通过多个所述门控网络分别融合相应场景下的所述私有专家输出和所述目标编码向量、以及所述共享专家输出,输出多个所述目标特征向量,包括:
12、通过多个所述门控网络对相应场景下的所述目标编码向量进行处理,得到多个初始门控向量;
13、根据多个所述初始门控向量分别与场景标识向量和场景均匀向量计算相关性,得到多个第一相关性向量和多个第二相关性向量,其中,所述场景标识向量中与目标场景对应的元素为1,与其他场景对应的元素为0,所述场景均匀向量中各元素为m为多个场景的数量;
14、针对每一所述第一相关性向量和每一所述第二相关性向量,根据所述第一相关性向量中的第一最大元素和所述第二相关性向量中的第二最大元素各自的位置进行求并集处理,得到多个门控掩码向量;
15、根据多个所述门控掩码向量对多个所述初始门控向量分别进行掩码处理,得到多个目标门控向量;
16、根据多个所述目标门控向量与相应场景下的所述私有专家输出和所述共享专家输出进行融合处理,输出多个所述目标特征向量。
17、可选地,所述根据多个初始门控向量分别与场景标识向量和场景均匀向量计算相关性,得到多个第一相关性向量和多个第二相关性向量,包括:
18、根据多个所述初始门控向量分别与所述场景标识向量和所述场景均匀向量进行相对熵计算,以计算所述相关性,得到多个所述第一相关性向量和多个所述第二相关性向量。
19、可选地,所述根据目标掩码网络保留多个所述场景中的所述目标场景的目标任务预测结果,并过滤掉其他场景的其他任务预测结果,以及输出所述目标任务预测结果,包括:
20、将多个所述场景下的任务预测结果与所述目标掩码网络的目标掩码向量进行乘积运算,以保留所述目标任务预测结果,并过滤掉所述其他任务预测结果,其中,所述目标掩码向量中与所述目标任务预测结果对应的元素为1,与所述其他任务预测结果对应的元素为0。
21、可选地,所述方法还包括:
22、获取所述目标场景的目标场景标识;
23、根据辅助网络对所述目标场景标识进行处理,得到辅助网络输出;
24、所述根据所述目标任务预测结果确定所述待推荐对象在所述目标场景下的推荐结果,包括:
25、根据所述辅助网络输出和所述目标任务预测结果,确定所述待推荐对象在所述目标场景下的所述推荐结果。
26、可选地,所述特征信息包括待推荐对象的对象特征、所述目标场景的目标场景标识、待展示推荐对象的用户的行为特征、以及所述用户的关联特征。
27、可选地,所述对所述特征信息进行编码处理,得到目标编码向量,包括:
28、根据编码层对所述对象特征、所述目标场景标识、所述行为特征以及所述关联特征进行编码处理,得到第一编码向量;
29、根据注意力层对所述行为特征进行注意力处理,得到第二编码向量;
30、融合所述第一编码向量和所述第二编码向量,得到所述目标编码向量。
31、可选地,所述信息预测模型通过以下方式训练得到:
32、确定初始信息预测模型,所述初始信息预测模型包括所述定制门控网络、与多个所述场景对应的多个所述任务预测网络以及所述目标掩码网络;
33、获取多个训练样本,每一所述训练样本包括样本对象的样本特征信息,多个所述训练样本中的所述样本对象来自于多个场景;
34、根据多个所述训练样本迭代更新初始信息预测模型的损失函数值,得到所述训练完成的信息预测模型,其中,每一所述训练样本对应的损失函数值,通过以下方式得到:
35、对所述训练样本的所述样本特征信息进行编码处理,得到目标样本编码向量;
36、将所述目标样本编码向量输入所述初始信息预测模型,通过所述定制门控网络中的共享专家网络以及与多个所述场景对应的多个私有专家网络,输出与多个所述场景对应的多个目标样本特征向量;
37、根据多个所述任务预测网络对相应场景下的目标样本特征向量进行处理,得到所述训练样本在多个所述场景下的预设任务的样本任务预测结果;
38、根据目标掩码网络保留多个所述场景中的目标样本场景的目标样本任务预测结果,并过滤其他场景的其他样本任务预测结果,以及输出所述目标样本任务预测结果,所述目标样本场景是多个所述场景中所述训练样本的样本对象所属的场景;
39、根据所述目标样本任务预测结果确定所述损失函数值。
40、根据本公开实施例的第二方面,提供一种信息确定装置,包括:
41、第一获取模块,被配置为获取目标场景下的待推荐对象对应的特征信息,所述目标场景是多个场景中的任一个;
42、第一编码模块,被配置对所述特征信息进行编码处理,得到目标编码向量;
43、门控模块,被配置为将目标编码向量输入训练完成的信息预测模型,所述信息预测模型包括定制门控网络、与多个所述场景对应的多个任务预测网络以及目标掩码网络,通过所述定制门控网络中的共享专家网络以及与多个所述场景对应的多个私有专家网络,输出与多个所述场景对应的多个目标特征向量;
44、任务预测模块,被配置为根据多个所述任务预测网络对相应场景下的所述目标特征向量进行处理,得到所述待推荐对象在多个所述场景下的预设任务的任务预测结果;
45、掩码模块,被配置为根据目标掩码网络保留多个所述场景中的所述目标场景的目标任务预测结果,并过滤掉其他场景的其他任务预测结果,以及输出所述目标任务预测结果;
46、确定模块,被配置为根据所述目标任务预测结果确定所述待推荐对象在所述目标场景下的推荐结果。
47、根据本公开实施例的第三方面,提供一种信息确定装置,包括:
48、处理器;
49、用于存储处理器可执行指令的存储器;
50、其中,所述处理器被配置为:
51、获取目标场景下的待推荐对象对应的特征信息,所述目标场景是多个场景中的任一个;
52、对所述特征信息进行编码处理,得到目标编码向量;
53、将目标编码向量输入训练完成的信息预测模型,所述信息预测模型包括定制门控网络、与多个所述场景对应的多个任务预测网络以及目标掩码网络,通过所述定制门控网络中的共享专家网络以及与多个所述场景对应的多个私有专家网络,输出与多个所述场景对应的多个目标特征向量;
54、根据多个所述任务预测网络对相应场景下的所述目标特征向量进行处理,得到所述待推荐对象在多个所述场景下的预设任务的任务预测结果;
55、根据所述目标掩码网络保留多个所述场景中的所述目标场景的目标任务预测结果,并过滤掉其他场景的其他任务预测结果,以及输出所述目标任务预测结果;
56、根据所述目标任务预测结果确定所述待推荐对象在所述目标场景下的推荐结果。
57、根据本公开实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机程序指令,该程序指令被处理器执行时实现本公开第一方面任一项所提供的方法的步骤。
58、本公开的实施例提供的技术方案可以包括以下有益效果:通过定制门控网络中的共享专家网络和多个私有专家网络,输出的多个目标特征向量能够提取到目标场景独立的信息,也能提取到目标场景与多个场景中除目标场景以外的其他场景之间的共有信息,使得本公开既能通过同一模型预测多个场景下的任务预测结果,也能提高任一场景下得到的任务预测结果的准确度,并且能够大幅减少模型的算力成本和维护成本。
59、应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本公开。
1.一种信息确定方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述定制门控网络包括与多个所述场景对应的多个门控网络,所述通过所述定制门控网络中的共享专家网络以及与多个所述场景对应的多个私有专家网络,输出与多个所述场景对应的多个目标特征向量,包括:
3.根据权利要求2所述的方法,其特征在于,所述通过多个所述门控网络分别融合相应场景下的所述私有专家输出和所述目标编码向量、以及所述共享专家输出,输出多个所述目标特征向量,包括:
4.根据权利要求3所述的方法,其特征在于,所述根据多个初始门控向量分别与场景标识向量和场景均匀向量计算相关性,得到多个第一相关性向量和多个第二相关性向量,包括:
5.根据权利要求1所述的方法,其特征在于,所述根据目标掩码网络保留多个所述场景中的所述目标场景的目标任务预测结果,并过滤掉其他场景的其他任务预测结果,以及输出所述目标任务预测结果,包括:
6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
7.根据权利要求1所述的方法,其特征在于,所述特征信息包括待推荐对象的对象特征、所述目标场景的目标场景标识、待展示推荐对象的用户的行为特征、以及所述用户的关联特征。
8.根据权利要求6所述的方法,其特征在于,所述对所述特征信息进行编码处理,得到目标编码向量,包括:
9.根据权利要求1所述的方法,其特征在于,所述信息预测模型通过以下方式训练得到:
10.一种信息确定装置,其特征在于,包括:
11.一种信息确定装置,其特征在于,包括:
12.一种计算机可读存储介质,其上存储有计算机程序指令,其特征在于,该程序指令被处理器执行时实现权利要求1~9中任一项所述方法的步骤。