本公开涉及大数据、数字营销、人工智能,具体地涉及一种图谱数据处理方法及装置、模型训练方法及装置、设备。
背景技术:
1、随着电子商务平台的兴起,各种商品的丰富信息已经可用。这些商品通过不同类型的关系(例如由同一用户共同查看或共同购买)明示或暗示地连接起来,形成大量的信息图谱,其中商品被表示为节点,它们之间的关系被表示为边。利用这样的图结构对于了解商品的特性非常重要,这可以促进广泛的应用,例如推荐系统和在线广告。
2、在实现本公开构思的过程中,发明人发现相关技术中至少存在如下问题,基于预先构建的信息图谱进行数据分析的过程中,需要从图谱中挖掘有效信息,现有的处理方法不能准确挖掘图谱的完整信息,图谱处理效果不佳。
技术实现思路
1、鉴于上述问题,本公开提供了一种图谱数据处理方法及装置、模型训练方法及装置、设备。
2、本公开的一个方面,提供了一种图谱数据处理方法,包括:
3、读取待处理的信息图谱,其中,信息图谱是基于用户针对多个物品的历史操作行为数据预先构建的,信息图谱中的节点包括用户节点和物品节点,用户节点和物品节点之间的边代表用户针对物品的多种预定操作行为之一;
4、基于信息图谱生成第一特征向量和第二特征向量,其中,第一特征向量用于表征:用户针对多个物品中的第一类物品的第一操作行为特征,第二特征向量用于表征:用户针对多个物品中的第二类物品的第二操作行为特征;
5、将第一特征向量和第二特征向量进行融合处理,生成融合特征向量;
6、对第一特征向量、第二特征向量、融合特征向量进行处理,生成目标特征向量,其中,目标特征向量用于表征:用户针对感兴趣的目标物品的目标操作行为特征。
7、根据本公开的实施例,对第一特征向量、第二特征向量、融合特征向量进行处理,生成目标特征向量包括:
8、从物品信息库中,确定与第一特征向量、第二特征向量、融合特征向量存在关联的多个目标物品;
9、基于用户和多个目标物品构建超图;
10、将超图输入超图解析模型进行信息解析,生成目标特征向量。
11、根据本公开的实施例,其中,从物品信息库中,确定与第一特征向量、第二特征向量、融合特征向量存在关联的多个目标物品包括:
12、利用预定检索算法,从物品向量库中检索到与第一特征向量、第二特征向量、融合特征向量之间满足预设相似度条件的相似向量,其中,物品向量库基于物品信息库中的商品信息构建得到;
13、根据相似向量,确定多个目标物品。
14、根据本公开的实施例,其中,基于信息图谱生成第一特征向量和第二特征向量包括:
15、将信息图谱输入第一图嵌入模型,以使得第一图嵌入模型基于第一图嵌入方法对信息图谱进行第一图嵌入处理,生成第一特征向量;
16、将信息图谱输入第二图嵌入模型,以使得第二图嵌入模型基于第二图嵌入方法对信息图谱进行第二图嵌入处理,生成第二特征向量。
17、根据本公开的实施例,其中,基于信息图谱生成第一特征向量包括:
18、从信息图谱中分别提取第一图谱节点信息和第一图谱边信息;
19、将第一图谱节点信息和第一图谱边信息进行信息融合嵌入处理,生成第一特征向量。
20、根据本公开的实施例,其中,基于信息图谱生成第二特征向量包括:
21、基于信息图谱生成节点的静态属性特征;
22、基于节点的静态属性特征,分别构建第二图谱节点信息和第二图谱边信息;
23、将第二图谱节点信息和第二图谱边信息进行信息融合嵌入处理,生成第二特征向量。
24、根据本公开的实施例,其中:
25、多种预定操作行为至少包括:浏览、点击、加购、下单。
26、根据本公开的实施例,其中,将第一特征向量和第二特征向量进行融合处理,生成融合特征向量包括:
27、将第一特征向量和第二特征向量进行外积融合,生成融合特征向量。
28、本公开的另一个方面提供了一种图谱数据处理模型训练方法,包括:
29、读取图谱样本,其中,图谱样本是基于样本用户针对多个样本物品的历史操作行为数据样本预先构建的,图谱样本中的节点包括样本用户节点和样本物品节点,样本用户节点和样本物品节点之间的边代表样本用户针对样本物品的多种预定操作行为之一;
30、基于图谱样本生成第一特征向量样本和第二特征向量样本,其中,第一特征向量样本用于表征:样本用户针对多个样本物品中的第一类样本物品的第一操作行为特征,第二特征向量样本用于表征:样本用户针对多个样本物品中的第二类样本物品的第二操作行为特征,样本用户对第一类样本物品的感兴趣程度,大于对第二类样本物品的感兴趣程度;
31、将第一特征向量样本和第二特征向量样本进行融合处理,生成融合特征向量样本;
32、从物品信息库中,确定与第一特征向量样本、第二特征向量样本、融合特征向量样本存在关联的多个目标样本物品;
33、基于样本用户和多个目标样本物品构建超图样本;
34、利用超图样本训练初始模型,得到训练好的超图解析模型。
35、根据本公开的实施例,其中,基于图谱样本生成第一特征向量样本和第二特征向量样本包括:
36、将图谱样本输入第一图嵌入模型,以使得第一图嵌入模型从图谱样本中分别提取第一图谱节点信息样本和第一图谱边信息样本,并将第一图谱节点信息样本和第一图谱边信息样本进行信息融合嵌入处理,生成第一特征向量样本;
37、将图谱样本输入第二图嵌入模型,以使得第二图嵌入模型基于图谱样本生成节点的静态属性特征样本、基于静态属性特征样本分别构建第二图谱节点信息样本和第二图谱边信息样本,并将第二图谱节点信息样本和第二图谱边信息样本进行信息融合嵌入处理,生成第二特征向量样本。
38、本公开的另一个方面提供了一种图谱数据处理装置,包括:
39、图谱读取模块,用于读取待处理的信息图谱,其中,信息图谱是基于用户针对多个物品的历史操作行为数据预先构建的,信息图谱中的节点包括用户节点和物品节点,用户节点和物品节点之间的边代表用户针对物品的多种预定操作行为之一;
40、第一生成模块,用于基于信息图谱生成第一特征向量和第二特征向量,其中,第一特征向量用于表征:用户针对多个物品中的第一类物品的第一操作行为特征,第二特征向量用于表征:用户针对多个物品中的第二类物品的第二操作行为特征,所述用户对所述第一类物品的感兴趣程度,大于对所述第二类物品的感兴趣程度;
41、特征融合模块,用于将第一特征向量和第二特征向量进行融合处理,生成融合特征向量;
42、第二生成模块,用于对第一特征向量、第二特征向量、融合特征向量进行处理,生成目标特征向量,其中,目标特征向量用于表征:用户针对感兴趣的目标物品的目标操作行为特征。
43、根据本公开的实施例,第二生成模块包括:
44、确定单元,用于从物品信息库中,确定与第一特征向量、第二特征向量、融合特征向量存在关联的多个目标物品;
45、构建单元,用于基于用户和多个目标物品构建超图;
46、第一生成单元,用于将超图输入超图解析模型进行信息解析,生成目标特征向量。
47、根据本公开的实施例,其中,确定单元包括:
48、检索子单元,用于利用预定检索算法,从物品向量库中检索到与第一特征向量、第二特征向量、融合特征向量之间满足预设相似度条件的相似向量,其中,物品向量库基于物品信息库中的商品信息构建得到;
49、确定子单元,用于根据相似向量,确定多个目标物品。
50、根据本公开的实施例,其中,第一生成模块包括:
51、第一图嵌入单元,用于将信息图谱输入第一图嵌入模型,以使得第一图嵌入模型基于第一图嵌入方法对信息图谱进行第一图嵌入处理,生成第一特征向量;
52、第二图嵌入单元,用于将信息图谱输入第二图嵌入模型,以使得第二图嵌入模型基于第二图嵌入方法对信息图谱进行第二图嵌入处理,生成第二特征向量。
53、根据本公开的实施例,其中,第一生成模块包括:
54、提取单元,用于从信息图谱中分别提取第一图谱节点信息和第一图谱边信息;
55、第一处理单元,用于将第一图谱节点信息和第一图谱边信息进行信息融合嵌入处理,生成第一特征向量。
56、根据本公开的实施例,其中,第一生成模块包括:
57、第二生成单元,用于基于信息图谱生成节点的静态属性特征;
58、构建单元,用于基于节点的静态属性特征,分别构建第二图谱节点信息和第二图谱边信息;
59、第二处理单元,用于将第二图谱节点信息和第二图谱边信息进行信息融合嵌入处理,生成第二特征向量。
60、根据本公开的实施例,其中:
61、多种预定操作行为至少包括:浏览、点击、加购、下单。
62、根据本公开的实施例,其中,特征融合模块包括:
63、特征融合单元,用于将第一特征向量和第二特征向量进行外积融合,生成融合特征向量。
64、本公开的另一个方面提供了一种图谱数据处理模型训练装置,包括:
65、样本读取模块,用于读取图谱样本,其中,图谱样本是基于样本用户针对多个样本物品的历史操作行为数据样本预先构建的,图谱样本中的节点包括样本用户节点和样本物品节点,样本用户节点和样本物品节点之间的边代表样本用户针对样本物品的多种预定操作行为之一;
66、样本生成模块,用于基于图谱样本生成第一特征向量样本和第二特征向量样本,其中,第一特征向量样本用于表征:样本用户针对多个样本物品中的第一类样本物品的第一操作行为特征,第二特征向量样本用于表征:样本用户针对多个样本物品中的第二类样本物品的第二操作行为特征,样本用户对第一类样本物品的感兴趣程度,大于对第二类样本物品的感兴趣程度;
67、样本融合模块,用于将第一特征向量样本和第二特征向量样本进行融合处理,生成融合特征向量样本;
68、关联模块,用于从物品信息库中,确定与第一特征向量样本、第二特征向量样本、融合特征向量样本存在关联的多个目标样本物品;
69、构建模块,用于基于样本用户和多个目标样本物品构建超图样本;
70、训练模块,用于利用超图样本训练初始模型,得到训练好的超图解析模型。
71、根据本公开的实施例,其中,样本生成模块包括:
72、第一样本生成单元,用于将图谱样本输入第一图嵌入模型,以使得第一图嵌入模型从图谱样本中分别提取第一图谱节点信息样本和第一图谱边信息样本,并将第一图谱节点信息样本和第一图谱边信息样本进行信息融合嵌入处理,生成第一特征向量样本;
73、第二样本生成单元,用于将图谱样本输入第二图嵌入模型,以使得第二图嵌入模型基于图谱样本生成节点的静态属性特征样本、基于静态属性特征样本分别构建第二图谱节点信息样本和第二图谱边信息样本,并将第二图谱节点信息样本和第二图谱边信息样本进行信息融合嵌入处理,生成第二特征向量样本。
74、本公开的另一个方面提供了一种电子设备,包括:一个或多个处理器;存储器,用于存储一个或多个程序,其中,当所述一个或多个程序被所述一个或多个处理器执行时,使得一个或多个处理器执行上述图谱数据处理方法。
75、本公开的另一个方面还提供了一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行上述图谱数据处理方法。
76、本公开的另一个方面还提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述图谱数据处理方法。
77、根据本发明的实施例,信息图谱是用户兴趣精准表达和兴趣泛化的信息载体,通过上述方法,基于信息图谱生成的第一特征向量,可以得到用户对感兴趣程度较高的第一类物品的行为信息,基于信息图谱生成的第二特征向量,可以得到用户对感兴趣程度较低的第二类物品的行为信息;因此,进一步通过将第一特征向量和第二特征向量进行融合处理,以及基于第一特征向量、第二特征向量、融合特征向量生成的目标特征向量,不仅能够精准挖掘第一类物品的兴趣特征,同时兼顾第二类物品的兴趣特征,可以准确完整地挖掘图谱信息;解决了相关技术中不能准确挖掘图谱的完整信息,无法同时兼顾不同感兴趣程度物品信息的问题,提升了图谱信息挖掘的信息表征效果,提高了用户体验,基于提取出的信息用于产品推荐中,可较大程度增强产品推荐的效果。
1.一种图谱数据处理方法,包括:
2.根据权利要求1所述的方法,对所述第一特征向量、所述第二特征向量、所述融合特征向量进行处理,生成目标特征向量包括:
3.根据权利要求2所述的方法,其中,从物品信息库中,确定与所述第一特征向量、所述第二特征向量、所述融合特征向量存在关联的多个目标物品包括:
4.根据权利要求1所述的方法,其中,基于所述信息图谱生成第一特征向量和第二特征向量包括:
5.根据权利要求1所述的方法,其中,基于所述信息图谱生成第一特征向量包括:
6.根据权利要求1所述的方法,其中,基于所述信息图谱生成第二特征向量包括:
7.根据权利要求1所述的方法,其中,将所述第一特征向量和所述第二特征向量进行融合处理,生成融合特征向量包括:
8.一种图谱数据处理模型训练方法,包括:
9.根据权利要求8所述的方法,其中,基于所述图谱样本生成第一特征向量样本和第二特征向量样本包括:
10.一种图谱数据处理装置,包括:
11.一种图谱数据处理模型训练装置,包括:
12.一种电子设备,包括:
13.一种计算机可读存储介质,其上存储有可执行指令,该指令被处理器执行时使处理器执行根据权利要求1~9中任一项所述的方法。
14.一种计算机程序产品,包括计算机程序,所述计算机程序被处理器执行时实现根据权利要求1~9中任一项所述的方法。
