1.本发明涉及计算机技术领域,尤其涉及一种产品评价模型的训练方法、产品评价方法及装置、设备。
背景技术:2.随着电子商务的不断发展,产品评价成为了非常关键的问题,在搜索排序、产品推荐中都占据重要地位。一方面,用户可以通过关键词搜索获取与之相关的结果,并根据自己的喜好和平台的推荐选择心仪的产品;另一方面,由于搜索排序排名靠前的产品占有大部分流量,可以获得更多曝光,供应商希望产品的评价、排序标准是透明的,这样他们可以采取合理的措施优化自己的产品,这也就要求产品评价方法是可解释的。
3.目前,解决产品评价可解释的问题,采取的方法是用单调模型进行产品评价;然而,这种评价方式存在难以拟合复杂特征、评价准确度较低的问题。
技术实现要素:4.本发明要解决的技术问题是为了克服现有技术中缺少合理的可解释产品评价方法、导致产品评价准确性低的缺陷,提供一种产品评价模型的训练方法、产品评价方法及装置、设备。
5.本发明是通过下述技术方案来解决上述技术问题:
6.本发明提供一种产品评价模型的训练方法,包括以下步骤:
7.获取产品的样本数据,所述样本数据包括第一样本特征数据、第二样本特征数据和样本评价数据;
8.将所述第一样本特征数据输入产品评价模型的单调网络模块,将所述第二样本特征数据输入产品评价模型的非单调网络模块,其中,所述单调网络模块和所述非单调网络模块通过全连接层结合,输出所述产品的评价数据;所述单调网络模块的输出值与输入值之间呈单调关系,所述非单调网络模块的输出值与输入值之间呈非单调关系;
9.根据所述样本评价数据和输出的评价数据计算损失;并根据所述损失调整所述产品评价模型的参数,直至满足预设收敛条件。
10.较佳地,所述第一样本特征数据包括所述产品的特征数据,所述第二样本特征数据包括所述产品的特征数据以及用户的特征数据。
11.本发明还提供一种产品评价方法,包括以下步骤:
12.获取待评价产品的相关数据,所述相关数据包括第一特征数据和第二特征数据;
13.将所述第一特征数据输入产品评价模型的单调网络模块,将所述第二特征数据输入所述产品评价模型的非单调网络模块,输出所述待评价产品的评价数据;
14.其中,所述产品评价模型根据上述的产品评价模型的训练方法训练得到。
15.较佳地,所述待评价产品的数量为多个,所述产品评价方法还包括:
16.基于多个待评价产品的评价数据,对多个待评价产品进行排序。
17.本发明还提供一种产品评价模型的训练装置,包括:
18.样本获取模块,用于获取产品的样本数据,所述样本数据包括第一样本特征数据、第二样本特征数据和样本评价数据;
19.分类输入模块,用于将所述第一样本特征数据输入产品评价模型的单调网络模块,将所述第二样本特征数据输入产品评价模型的非单调网络模块,其中,所述单调网络模块和所述非单调网络模块通过全连接层结合,输出所述产品的评价数据;所述单调网络模块的输出值与输入值之间呈单调关系,所述非单调网络模块的输出值与输入值之间呈非单调关系;
20.参数调整模块,用于根据所述样本评价数据和输出的评价数据计算损失;并根据所述损失调整所述产品评价模型的参数,直至满足预设收敛条件。
21.较佳地,所述第一样本特征数据包括所述产品的特征数据,所述第二样本特征数据包括所述产品的特征数据以及用户的特征数据。
22.本发明还提供一种产品评价装置,包括:
23.数据获取模块,用于获取待评价产品的相关数据,所述相关数据包括第一特征数据和第二特征数据;
24.产品评价模块,将所述第一特征数据输入产品评价模型的单调网络模块,将所述第二特征数据输入所述产品评价模型的非单调网络模块,输出所述待评价产品的评价数据;
25.其中,所述产品评价模型根据上述的产品评价模型的训练方法训练得到。
26.较佳地,所述待评价产品的数量为多个,所述产品评价装置还包括排序模块,用于基于多个待评价产品的评价数据,对多个待评价产品进行排序。
27.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上运行的计算机程序,处理器执行计算机程序时实现上述的产品评价模型的训练方法,或者上述的产品评价方法。
28.本发明还提供一种计算机可读存储介质,存储计算机程序,计算机程序被处理器执行时实现上述的产品评价模型的训练方法,或者上述的产品评价方法。
29.在符合本领域常识的基础上,所述各优选条件,可任意组合,即得本发明各较佳实施例。
30.本发明的积极进步效果在于:通过对产品评价模型中的单调网络模块和非单调网络模块进行联合训练,一方面可以保证部分输入与输出之间的单调关系,解决了对供应商可解释的问题;另一方面可以提高产品评价模型的性能,进而提高产品评价结果的准确性。
附图说明
31.图1为本发明实施例1的产品评价模型的训练方法的流程图。
32.图2为本发明实施例1的产品评价模型的结构示意图。
33.图3为本发明实施例2的产品评价方法的流程图。
34.图4为本发明实施例2的产品评价方法的应用示意图。
35.图5为本发明实施例2的产品评价方法的输出值随销量的变化趋势示意图。
36.图6为本发明实施例3的产品评价模型的训练装置的模块示意图。
37.图7为本发明实施例4的产品评价装置的模块示意图。
38.图8为本发明实施例5的电子设备的结构示意图。
具体实施方式
39.下面通过实施例的方式进一步说明本发明,但并不因此将本发明限制在所述的实施例范围之中。
40.实施例1
41.本实施例提供一种产品评价模型的训练方法,参照图1,该训练方法包括以下步骤:
42.s1、获取产品的样本数据,所述样本数据包括第一样本特征数据、第二样本特征数据和样本评价数据;
43.s2、将所述第一样本特征数据输入产品评价模型的单调网络模块,将所述第二样本特征数据输入产品评价模型的非单调网络模块,其中,所述单调网络模块和所述非单调网络模块通过全连接层结合,输出所述产品的评价数据;所述单调网络模块的输出值与输入值之间呈单调关系,所述非单调网络模块的输出值与输入值之间呈非单调关系;
44.s3、根据所述样本评价数据和输出的评价数据计算损失;并根据所述损失调整所述产品评价模型的参数,直至满足预设收敛条件。
45.具体地,步骤s1中产品的第一样本特征数据是与输出保持单调关系的数据,第二样本特征数据是与输出保持非单调关系的数据,样本评价数据是基于用户点击率、成交率等数据对产品进行的综合评价。例如,在电商平台搜索排序的场景中,若要保证产品评价结果是对供应商可解释的,就要控制产品的部分特征(如价格、好评率等)与输出的评价数据(如得分等)是具有单调关系的,供应商可以采取措施优化产品的这一部分特征来提升产品的评价结果,其他特征则不要求与输出保持单调关系。
46.参照图2,步骤s2中的产品评价模型是一种部分单调模型,包括单调网络模块和非单调网络模块。单调网络模块接收要和输出保持单调关系的稠密特征,该模块的权重非负,具体可以是对权重进行先平方再开方处理。非单调网络接收稀疏特征和稠密特征,并对部分稀疏特征进行嵌入化处理,来减少参数。两个模块之间保持了一定的权重交叉来提高网络表达能力。根据步骤s1中对产品的样本数据的分类,将第一样本特征数据和第二样本特征数据分别输入产品评价模型的单调网络模块和非单调网络模块,两个模块通过全连接层结合,输出样本的评价数据。
47.根据步骤s2输出的评价数据和样本评价数据计算损失,并根据损失调整参数,直至满足预设收敛条件,训练得到产品评价模型。
48.当然,在对产品评价模型进行训练的过程中,还可以:使用sigmoid(一种激活函数)、prelu(一种激活函数),tanh(一种激活函数)等激活函数提高训练的稳定性;对参数进行正则化处理,提高产品评价模型的泛化能力;使用小批次进行训练,训练期间按计划降低学习率。至于具体如何进行上述优化,则是本领域的技术人员容易得到的,故在此不再赘述。
49.在一可实施的方案中,所述第一样本特征数据包括所述产品的特征数据,所述第二样本特征数据包括所述产品的特征数据以及用户的特征数据。
50.具体地,在电商平台搜索排序的场景中,要解决排序结果对供应商可解释的问题,需要将产品特征分为需要解释的特征和不需要解释的特征,所有的用户特征都是不需要解释的特征。将需要解释的特征作为第一样本特征数据,输入产品评价模型的单调网络模块;将不需要解释的特征作为第二样本特征数据,输入产品评价模型的非单调网络模块。
51.本实施例提供的产品评价模型的训练方法,通过对部分单调模型中的单调网络模块和非单调网络模块进行联合训练,一方面可以保证部分输入与输出之间的单调关系,基于该单调关系,供应商可以得知优化产品的哪些特征可以提高产品评价结果;另一方面可以提高产品评价模型的性能,进而提高产品评价结果的准确性。
52.实施例2
53.本实施例提供一种产品评价方法,参照图3,该方法包括以下步骤:
54.s4、获取待评价产品的相关数据,所述相关数据包括第一特征数据和第二特征数据;
55.s5、将所述第一特征数据输入产品评价模型的单调网络模块,将所述第二特征数据输入所述产品评价模型的非单调网络模块,输出所述待评价产品的评价数据;
56.其中,所述产品评价模型根据实施例1的训练方法训练得到。
57.在一可实施的方案中,本实施例提供的产品评价方法还包括以下步骤:
58.s6、基于多个待评价产品的评价数据,对多个待评价产品进行排序。
59.参照图4,以一具体应用为例说明本实施例提供的产品评价方法:
60.(1)根据业务需求,将产品特征分为需要解释的特征和不需要解释的特征,用户特征都是不需要解释的特征;
61.(2)获取需要解释的特征作为第一特征数据,输入产品评价模型的单调网络模块,获取不需要解释的特征作为第二特征数据,输入产品评价模型的非单调网络模块,两个模块对数据进行前向传播得到输出的评价数据,如得分;
62.(3)对产品评价模型进行验证;
63.(4)基于产品评价模型为供应商提供服务:根据输出的评价数据例如得分的大小进行由高到低排序;
64.(5)生成产品力看板,并根据需求对供应商进行可解释答疑。
65.具体地,供应商可解释包括但不限于以下三个方面:
66.1)如何提升产品排名:由于部分单调模型的输出和需要解释的特征之间是单调关系,因此对于需要解释的特征来说,优化该特征(如提高产品的好评率),输出的评价数据就会提高,进而提升产品排名;
67.2)优先提升哪些特征来提升排名:优先提升的特征就是通过微小的变化,就可以快速提高得分的特征。参照图5,以输出值随销量的变化趋势为例,变化趋势曲线的中间段阴影部分是特定排名位次的产品的销量特征的右导数区域,对于该产品的若干个特征,将右导数作为因子权重进行由高到低排序,得分最高的特征就是要优先提升的特征;
68.3)竞品比较:竞品比较就是比较两个产品的差别,主要服务于低位次产品和高位次产品的比较,来获取提升排序的建议。其获取建议的方式为,对两个产品的若干个特征的差值和因子权重的乘积进行由高到低排序,乘积最高值对应的特征作为建议提升的特征。
69.本实施例提供的产品评价方法,可以解决产品的评价结果以及排序结果对供应商
可解释的问题,增强供应商对平台的信任;同时提高了产品评价结果以及排序结果的准确性,为用户提供了更精准、更高效的服务。
70.实施例3
71.本实施例提供一种产品评价模型的训练装置,参照图6,该装置包括:
72.样本获取模块1,用于获取产品的样本数据,所述样本数据包括第一样本特征数据、第二样本特征数据和样本评价数据;
73.分类输入模块2,用于将所述第一样本特征数据输入产品评价模型的单调网络模块,将所述第二样本特征数据输入产品评价模型的非单调网络模块,其中,所述单调网络模块和所述非单调网络模块通过全连接层结合,输出所述产品的评价数据;所述单调网络模块的输出值与输入值之间呈单调关系,所述非单调网络模块的输出值与输入值之间呈非单调关系;
74.参数调整模块3,用于根据所述样本评价数据和输出的评价数据计算损失;并根据所述损失调整所述产品评价模型的参数,直至满足预设收敛条件。
75.在一可实施的方案中,所述第一样本特征数据包括所述产品的特征数据,所述第二样本特征数据包括所述产品的特征数据以及用户的特征数据。
76.由于本实施例提供的产品评价模型的训练装置与实施例1提供的产品评价模型的训练方法的实现原理类似、有益效果类似,故在此不再赘述。
77.实施例4
78.本实施例提供一种产品评价装置,参照图7,该装置包括:
79.数据获取模块4,用于获取待评价产品的相关数据,所述相关数据包括第一特征数据和第二特征数据;
80.产品评价模块5,将所述第一特征数据输入产品评价模型的单调网络模块,将所述第二特征数据输入所述产品评价模型的非单调网络模块,输出所述待评价产品的评价数据;
81.其中,所述产品评价模型根据实施例1的产品评价模型的训练方法训练得到。
82.在一可实施的方案中,所述待评价产品的数量为多个,所述产品评价装置还包括排序模块6,用于基于多个待评价产品的评价数据,对多个待评价产品进行排序。
83.由于本实施例提供的产品评价装置与实施例2提供的产品评价方法的实现原理类似、有益效果类似,故在此不再赘述。
84.实施例5
85.本实施例提供一种电子设备,电子设备可以通过计算设备的形式表现(例如可以为服务器设备),包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其中处理器执行计算机程序时可以实现实施例1所提供的产品评价模型的训练方法,或者实施例2所提供的产品评价方法。
86.如图8所示,电子设备9具体包括:
87.至少一个处理器91、至少一个存储器92以及用于连接不同系统组件(包括处理器91和存储器92)的总线93,其中:
88.总线93包括数据总线、地址总线和控制总线。
89.存储器92包括易失性存储器,例如随机存取存储器(ram)921和/或高速缓存存储
器922,还可以进一步包括只读存储器(rom)923。
90.存储器92还包括具有一组(至少一个)程序模块924的程序/实用工具925,这样的程序模块924包括但不限于:操作系统、一个或者多个应用程序、其它程序模块以及程序数据,这些示例中的每一个或某种组合中可能包括网络环境的实现。
91.处理器91通过运行存储在存储器92中的计算机程序,从而执行各种功能应用以及数据处理,例如本发明实施例1所提供的产品评价模型的训练方法,或者实施例2所提供的产品评价方法。
92.电子设备9进一步可以与一个或多个外部设备94(例如键盘、指向设备等)通信。这种通信可以通过输入/输出(i/o)接口95进行。并且,电子设备9还可以通过网络适配器96与一个或者多个网络(例如局域网(lan),广域网(wan)和/或公共网络,例如因特网)通信。网络适配器96通过总线93与电子设备9的其它模块通信。应当明白,尽管图中未示出,可以结合电子设备9使用其它硬件和/或软件模块,包括但不限于:微代码、设备驱动器、冗余处理器、外部磁盘驱动阵列、raid(磁盘阵列)系统、磁带驱动器以及数据备份存储系统等。
93.应当注意,尽管在上文详细描述中提及了电子设备的若干单元/模块或子单元/模块,但是这种划分仅仅是示例性的并非强制性的。实际上,根据本技术的实施方式,上文描述的两个或更多单元/模块的特征和功能可以在一个单元/模块中具体化。反之,上文描述的一个单元/模块的特征和功能可以进一步划分为由多个单元/模块来具体化。
94.实施例6
95.本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现实施例1所提供的产品评价模型的训练方法,或者实施例2所提供的产品评价方法的步骤。
96.其中,可读存储介质可以采用的更具体可以包括但不限于:便携式盘、硬盘、随机存取存储器、只读存储器、可擦拭可编程只读存储器、光存储器件、磁存储器件或上述的任意合适的组合。
97.在可能的实施方式中,本发明还可以实现为一种程序产品的形式,其包括程序代码,当所述程序产品在终端设备上运行时,所述程序代码用于使所述终端设备执行实现实施例1所提供的产品评价模型的训练方法,或者实施例2所提供的产品评价方法的步骤。
98.其中,可以以一种或多种程序设计语言的任意组合来编写用于执行本发明的程序代码,所述程序代码可以完全地在用户设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户设备上部分在远程设备上执行或完全在远程设备上执行。
99.虽然以上描述了本发明的具体实施方式,但是本领域的技术人员应当理解,这仅是举例说明,本发明的保护范围是由所附权利要求书限定的。本领域的技术人员在不背离本发明的原理和实质的前提下,可以对这些实施方式做出多种变更或修改,但这些变更和修改均落入本发明的保护范围。
技术特征:1.一种产品评价模型的训练方法,其特征在于,所述产品评价模型的训练方法包括以下步骤:获取产品的样本数据,所述样本数据包括第一样本特征数据、第二样本特征数据和样本评价数据;将所述第一样本特征数据输入产品评价模型的单调网络模块,将所述第二样本特征数据输入产品评价模型的非单调网络模块,其中,所述单调网络模块和所述非单调网络模块通过全连接层结合,输出所述产品的评价数据;所述单调网络模块的输出值与输入值之间呈单调关系,所述非单调网络模块的输出值与输入值之间呈非单调关系;根据所述样本评价数据和输出的评价数据计算损失;并根据所述损失调整所述产品评价模型的参数,直至满足预设收敛条件。2.如权利要求1所述的产品评价模型的训练方法,其特征在于,所述第一样本特征数据包括所述产品的特征数据,所述第二样本特征数据包括所述产品的特征数据以及用户的特征数据。3.一种产品评价方法,其特征在于,所述产品评价方法包括以下步骤:获取待评价产品的相关数据,所述相关数据包括第一特征数据和第二特征数据;将所述第一特征数据输入产品评价模型的单调网络模块,将所述第二特征数据输入所述产品评价模型的非单调网络模块,输出所述待评价产品的评价数据;其中,所述产品评价模型根据权利要求1或2所述的训练方法训练得到。4.如权利要求3所述的产品评价方法,其特征在于,所述待评价产品的数量为多个,所述产品评价方法还包括:基于多个待评价产品的评价数据,对多个待评价产品进行排序。5.一种产品评价模型的训练装置,其特征在于,包括:样本获取模块,用于获取产品的样本数据,所述样本数据包括第一样本特征数据、第二样本特征数据和样本评价数据;分类输入模块,用于将所述第一样本特征数据输入产品评价模型的单调网络模块,将所述第二样本特征数据输入产品评价模型的非单调网络模块,其中,所述单调网络模块和所述非单调网络模块通过全连接层结合,输出所述产品的评价数据;所述单调网络模块的输出值与输入值之间呈单调关系,所述非单调网络模块的输出值与输入值之间呈非单调关系;参数调整模块,用于根据所述样本评价数据和输出的评价数据计算损失;并根据所述损失调整所述产品评价模型的参数,直至满足预设收敛条件。6.如权利要求5所述的产品评价模型的训练装置,其特征在于,所述第一样本特征数据包括所述产品的特征数据,所述第二样本特征数据包括所述产品的特征数据以及用户的特征数据。7.一种产品评价装置,其特征在于,包括:数据获取模块,用于获取待评价产品的相关数据,所述相关数据包括第一特征数据和第二特征数据;产品评价模块,将所述第一特征数据输入产品评价模型的单调网络模块,将所述第二特征数据输入所述产品评价模型的非单调网络模块,输出所述待评价产品的评价数据;
其中,所述产品评价模型根据权利要求1或2所述的训练方法训练得到。8.如权利要求7所述的产品评价装置,其特征在于,所述待评价产品的数量为多个,所述产品评价装置还包括排序模块,用于基于多个待评价产品的评价数据,对多个待评价产品进行排序。9.一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1或2所述的产品评价模型的训练方法,或者权利要求3或4所述的产品评价方法。10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1或2所述的产品评价模型的训练方法,或者权利要求3或4所述的产品评价方法。
技术总结本发明公开了一种产品评价模型的训练方法、产品评价方法及装置、设备,该训练方法包括:获取产品的样本数据,所述样本数据包括第一样本特征数据、第二样本特征数据和样本评价数据;将所述第一样本特征数据输入产品评价模型的单调网络模块,将所述第二样本特征数据输入产品评价模型的非单调网络模块,输出所述产品的评价数据;根据所述样本评价数据和输出的评价数据计算损失;并根据所述损失调整所述产品评价模型的参数,直至满足预设收敛条件。本发明通过产品评价模型的单调网络模块与非单调网络模块的联合训练,可以保证产品的部分特征与输出的评价数据之间的单调关系,同时还可以提高产品评价模型的性能,进而提高产品评价结果的准确性。结果的准确性。结果的准确性。
技术研发人员:王荣生 程婉玉 李健
受保护的技术使用者:上海携旅信息技术有限公司
技术研发日:2022.04.18
技术公布日:2022/7/5